MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Ai benchmarkok

A(z) Ai benchmarkok kategória legfrissebb mesterséges intelligencia hírei magyar nyelven.

5 hír ebben a kategóriában
A Surge AI kiadta a Riemann-bench-et a haladó matematikai érvelés tesztelésére
A Surge AI elindította a Riemann-bench-et, egy új matematikai benchmarkot, amelyet Ivy League professzorokkal együttműködve fejlesztettek ki. A benchmarkot a...
AI-modellek szerezték meg az élmezőnyt a programozó világbajnokságon
Az OpenAI és a Google AI-modelljei rekordméretű teljesítményt értek el az ICPC világdöntőjén, amely a legrangosabb egyetemi szintű programozóverseny. Az OpenAI...
Az Epoch AI elindítja a FrontierMath Tier 4-et a szakértői szintű érvelés tesztelésére
Az Epoch AI tesztelő szervezet elindította a FrontierMath Tier 4-et, amely rendkívül nehéz, kutatói szintű matematikai problémákból álló benchmark az AI...
A Salesforce CRMArena-Pro benchmarkja összetett üzleti logikán teszteli az LLM ágenseket
A Salesforce AI Research közzétette a CRMArena-Pro-t, egy „újszerű benchmarkot az LLM ágensek holisztikus, valósághű értékeléséhez különböző szakmai...
A Google DeepMind elindította a BIG-Bench Extra Hard-ot az érvelési modellek kihívás elé állítására
A Google DeepMind közzétette a „BIG-Bench Extra Hard” (BBEH) benchmarkot, a BIG-Bench egy új részhalmazát, amelyet úgy terveztek, hogy ellenálljon a gyors AI...