MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

A DeepMind benchmark tesztje rávilágít, hogy a hosszú kontextusú modellek nehézségekkel küzdenek a komplex érvelés terén

A Google DeepMind „Michelangelo-tesztje” jelentős korlátokat tárt fel még a legfejlettebb, hosszú kontextusú AI modelleknél is. Bár ezek a modellek technikailag képesek egyszerre több millió szó feldolgozására, a benchmark teszt azt mutatja, hogy gyakran küzdenek az összetett érvelési feladatokkal ugyanazon a hosszú kontextuson belül. Ez arra utal, hogy pusztán az adatok mennyiségének növelése, amit egy modell „lát”, nem javítja automatikusan a megértési képességét.
Miért fontos?

A hatalmas dokumentumhalmazok elemzésére AI-t használó vállalkozások számára ezek az eredmények emlékeztetőül szolgálnak: a nagyobb kontextusablak nem garantálja minden esetben a pontos vagy logikus meglátásokat.

Eredeti forrás megtekintése (angol) →