MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az OpenAI bemutatja az MLE-bench-et az AI ágensek értékeléséhez

Az OpenAI bemutatta az MLE-bench-et, egy új benchmarkot, amelynek célja annak értékelése, hogy az AI ágensek mennyire teljesítenek jól a valós gépi tanulási mérnöki feladatokban Kaggle versenyek használatával.
Miért fontos?

Az AI ágensek rohamléptekkel érkeznek — és új benchmarkokra van szükség az olyan képességek értékeléséhez, amelyek messze túlszárnyalják a korábbi tesztelési módszereket. Az OpenAI közleménye, az ágens-képességeket fejlesztő startupok hulláma és az új benchmarkok létrehozása között az AI ágens-forradalom bármelyik pillanatban berobbanhat. ---

Eredeti forrás megtekintése (angol) →