MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az MMLU-Pro nehezíti a benchmarkot, hogy lépést tartson a modellek gyors fejlődésével

Az MMLU az egyik legfontosabb benchmark, amellyel a nyelvi modellek fejlettségét mérik – az elmúlt hónapokban azonban olyan vezető modellek jelentek meg, amelyek túl jól teljesítenek ezen a teszten. Ahelyett, hogy teljesen új tesztet hoztak volna létre, kutatók kidolgozták az MMLU-Pro-t, az MMLU finomított és kibővített változatát. Összesen 12 187 kérdést adtak hozzá: 5 254 új kérdést, valamint 6 933-at az eredeti MMLU-ból válogatva.
Miért fontos?

Az AI fejlődésének nyomon követése olyan, mintha nyilakat dobálnánk egy takaró alá rejtett tárgyra – minél több nyilat dobunk, és minél közelebb találunk a tárgyhoz, annál nagyobb esélyünk van meghatározni és látni annak valódi alakját. Az olyan adathalmazok, mint az MMLU-Pro, egy újabb nyilat adnak a kezünkbe, a nehézsége pedig azt jelenti, hogy a nyíl hegye még élesebb lett. ---

Eredeti forrás megtekintése (angol) →