AI benchmarkok

A(z) AI benchmarkok kategória legfrissebb mesterséges intelligencia hírei magyar nyelven.

6 hír ebben a kategóriában

Az OSWORLD 2.0 benchmark többórás számítógépes feladatokon teszteli az AI-t

Az AI-fejlesztés egyik legizgalmasabb határterülete a valódi, számítógépes munkavégzés képességének megszerzése, amelyben mérföldkőnek számít az OSWORLD 2.0...

eredeti forrás · 2026. július 6.

AI benchmarkok

A Surge AI kiadta a Riemann-bench-et a haladó matematikai érvelés tesztelésére

A Surge AI elindította a Riemann-bench-et, egy új matematikai benchmarkot, amelyet Ivy League professzorokkal együttműködve fejlesztettek ki. A benchmarkot a...

eredeti forrás · 2026. március 26.

AI benchmarkok

AI-modellek szerezték meg az élmezőnyt a programozó világbajnokságon

Az OpenAI és a Google AI-modelljei rekordméretű teljesítményt értek el az ICPC világdöntőjén, amely a legrangosabb egyetemi szintű programozóverseny. Az OpenAI...

eredeti forrás · 2025. szeptember 18.

AI benchmarkok

Az Epoch AI elindítja a FrontierMath Tier 4-et a szakértői szintű érvelés tesztelésére

Az Epoch AI tesztelő szervezet elindította a FrontierMath Tier 4-et, amely rendkívül nehéz, kutatói szintű matematikai problémákból álló benchmark az AI...

eredeti forrás · 2025. július 14.

AI benchmarkok

A Salesforce CRMArena-Pro benchmarkja összetett üzleti logikán teszteli az LLM ágenseket

A Salesforce AI Research közzétette a CRMArena-Pro-t, egy „újszerű benchmarkot az LLM ágensek holisztikus, valósághű értékeléséhez különböző szakmai...

eredeti forrás · 2025. június 16.

AI benchmarkok

A Google DeepMind elindította a BIG-Bench Extra Hard-ot az érvelési modellek kihívás elé állítására

A Google DeepMind közzétette a „BIG-Bench Extra Hard” (BBEH) benchmarkot, a BIG-Bench egy új részhalmazát, amelyet úgy terveztek, hogy ellenálljon a gyors AI...

eredeti forrás · 2025. március 3.