MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

A legfejlettebb modellek megközelítik az emberi bázisértéket az utótanítás és a finomhangolás terén

A PostTrainBench azt méri, hogy a legfejlettebb AI-modellek mennyire képesek kisebb, nyílt forráskódú (open-weight) modellek finomhangolására a teljesítményük javítása érdekében különböző teszteken. Ezt a feladatot hagyományosan szakértő emberi kutatók végzik a vezető laboratóriumokban. A jelenlegi adatok azt mutatják, hogy az AI-rendszerek ma már képesek elérni az emberi szakértők által biztosított teljesítménynövekedés körülbelül felét. A 2026 áprilisi állapot szerint a legjobb rendszerek 25-28%-os súlyozott átlagos javulást érnek el a teszteken, szemben az 51%-os emberi bázisértékkel.
Miért fontos?

Ez közvetlen lépést jelent a rekurzív önfejlesztés felé, ahol az egyik modellt egy másik modell képességeinek és logikai következtetésének szisztematikus javítására használják.

Eredeti forrás megtekintése (angol) →