MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Kínai kutatók kifejlesztették a CMMU multimodális érvelési benchmarkot

A Beijing Academy of AI és más intézmények kutatói létrehozták a CMMU-t, a Massive Multi-discipline Multimodal Understanding (MMMU) benchmark kínai változatát. A CMMU hét tantárgy multimodális tartalmát öleli fel: matematika, biológia, fizika, kémia, földrajz, politika és történelem. Minden kérdés megköveteli a modelltől, hogy a kép- és szöveges tartalmat kombinálva generáljon átfogó választ. A kezdeti teszteken a GPT-4V nyújtotta a legjobb összteljesítményt, bár a kínai modellek kiváló eredményeket mutattak egyes nehéz szakaszokon.
Miért fontos?

A legtöbb AI tesztelési és értékelési rendszer nyugati és angol nyelvű elfogultsággal rendelkezik. A CMMU egyike azon számos példának, amikor kínai kutatók saját teszteket építenek, hogy nagyjából utánozzák a Nyugaton kifejlesztetteket. Ezek a tesztek módot adnak az AI rendszerek viselkedésének jellemzésére, és elengedhetetlen előfeltételei annak, hogy támpontokat kapjunk arról, hol hibáznak és hogyan javítható a teljesítményük.

Eredeti forrás megtekintése (angol) →