MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az OpenAI új benchmarkot vezetett be az o1 LLM-építő képességének tesztelésére

Az OpenAI alaposan próbára teszi új frontier modelljét. A startup bemutatott egy új benchmark tesztet, amellyel azt vizsgálják, mennyire képes az o1 más LLM-eket építeni és finomhangolni. A modell a feladatok körülbelül 17%-ában ért el legalább bronzérmes szintet. Ez talán nem tűnik soknak, de tartsuk szem előtt, hogy ezeket a versenyeket trükkösre tervezték, és teljesítésük még az emberek számára sem könnyű feladat.
Eredeti forrás megtekintése (angol) →