MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az OpenAI elindította a Health Bench-et a modellek orvosi feladatokon való tesztelésére

OpenAI frissítések: Health Bench – egy új benchmark, amely azt vizsgálja, mennyire hatékonyak a modellek a vészhelyzetek jelzésében, az egészségügyi adatfeldolgozásban, a pontos kommunikációban és egyéb területeken. Az o3 végzett az első helyen, a Grok a második, a Gemini 2.5 Pro pedig szinte ugyanazon a szinten teljesített.
Eredeti forrás megtekintése (angol) →