MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

A modern nagy nyelvi modellek értékelésének növekvő összetettsége és kihívásai

A nyelvi modellek értékelése meglepően összetett feladat. A hagyományos gépi tanulási feladatokkal ellentétben – ahol világosan meghatározhatók a helyes kimenetek – az LLM-ek egy nyitott végű térben működnek, ahol a válaszok kreatívak, szubjektívek és erősen kontextusfüggőek lehetnek. Gyakran nincs egyetlen üdvözítő válasz. A hagyományos akadémiai benchmarkok, mint az MMLU (Massive Multitask Language Understanding) vagy a GSM8K (általános iskolai matematika példatár), valamint az iparági ranglisták egyre kevésbé megbízható mutatói a valós teljesítménynek, többek között az adatszennyezés és a rendszerek növekvő összetettsége miatt.
Eredeti forrás megtekintése (angol) →