MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Új kutatások rávilágítanak a vezető multimodális modellek jelentős hibáira vizuális feladatok során

Kutatók megállapították, hogy a legkorszerűbb látásfunkciókkal rendelkező LLM-ek, mint a GPT-4o és a Gemini 1.5, alapvető vizuális feladatokkal is küszködnek, annak ellenére, hogy a benchmark teszteken kiválóan teljesítenek. Ez arra utal, hogy jelenlegi látásképességük súlyos rövidlátáshoz vagy "intelligens vaksághoz" hasonlítható.
Eredeti forrás megtekintése (angol) →