MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

A Poetiq startup vezeti az ARC-AGI-2 érvelési teljesítménymérőt, megelőzve a Google Gemini-t

Hat hónappal ezelőtt a legjobb AI modellek alig érték el az 5%-ot az ARC-AGI-2 érvelési benchmarkon. Ma egy apró startup épp most lépte át az 50%-ot – és közben a Google-t is legyőzte a cég saját modelljét használva. Egy olyan „meta-rendszerrel”, amely a meglévő modelleket finomítja ahelyett, hogy a semmiből építkezne, a Poetiq eredménye azt mutatja, hogy a következő áttörések az okos mérnöki megoldásokból, nem pedig pusztán a méret növeléséből fakadhatnak. A hatszemélyes Poetiq AI startup hivatalosan is átvette a vezetést az ARC-AGI-2 érvelési benchmarkon, legyőzve a Google Gemini 3 Deep Think modelljét feleakkora költség mellett, meglévő modellek összehangolásával a saját építése helyett.
Miért fontos?

Az ARC-AGI-2-n elért haladás 5% alattról 50% fölé mindössze hónapok alatt jól mutatja, milyen gyorsan fejlődnek a dolgok. A Poetiq módszere olyan jövőt vetít előre, ahol az AI fejlődése egyszerre két irányból érkezik: a határterületi modellek fejlesztéséből és a rájuk épülő okos koordinációs rendszerekből, amelyeket hatalmas számítási kapacitás nélkül dolgozó csapatok hoznak létre.

Eredeti forrás megtekintése (angol) →