MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

A Poetiq startup vezeti az ARC-AGI-2 érvelési teljesítménymérőt, megelőzve a Google Gemini-t

Hat hónappal ezelőtt a legjobb AI modellek alig érték el az 5%-ot az ARC-AGI-2 érvelési benchmarkon. Ma egy apró startup épp most lépte át az 50%-ot – és közben a Google-t is legyőzte a cég saját modelljét használva. Egy olyan „meta-rendszerrel”, amely a meglévő modelleket finomítja ahelyett, hogy a semmiből építkezne, a Poetiq eredménye azt mutatja, hogy a következő áttörések az okos mérnöki megoldásokból, nem pedig pusztán a méret növeléséből fakadhatnak.

A hatszemélyes Poetiq AI startup hivatalosan is átvette a vezetést az ARC-AGI-2 érvelési benchmarkon, legyőzve a Google Gemini 3 Deep Think modelljét feleakkora költség mellett, meglévő modellek összehangolásával a saját építése helyett.

Miért fontos?

Az ARC-AGI-2-n elért haladás 5% alattról 50% fölé mindössze hónapok alatt jól mutatja, milyen gyorsan fejlődnek a dolgok. A Poetiq módszere olyan jövőt vetít előre, ahol az AI fejlődése egyszerre két irányból érkezik: a határterületi modellek fejlesztéséből és a rájuk épülő okos koordinációs rendszerekből, amelyeket hatalmas számítási kapacitás nélkül dolgozó csapatok hoznak létre.

Eredeti forrás megtekintése (angol) →
Kapcsolódó hírek
A Mondo Robotics bemutatta Benit, az autonóm kamerarobotot tartalomgyártók számára
7 órája
A Booster Robotics humanoidja falat is átütő rúgással debütált a futballbemutatón
9 órája
Az Aceii A1 mobil teniszrobot dinamikus AI-edzést kínál
10 órája
Tudj meg többet
Perplexity AI: A Google-kereső AI-vel felturbózva
Gemini a Gmail-ben és a Google Docs-ban: Így automatizáld a munkád