Az OpenAI GPT-5 modellje túlszárnyalja az orvosokat a komplex orvosi érvelési vizsgákon

2025. augusztus 18. · MI Történik? · 1 perc olvasás

Az OpenAI GPT-5 lenyűgöző eredményeket ért el az orvosi érvelési benchmarkokon, az Emory University új tanulmánya szerint jelentős különbséggel előzte meg a GPT-4o-t és az egészségügyi szakembereket a diagnosztikai és multimodális feladatokban.

A modell 95,84%-os pontosságot ért el a MedQA klinikai kérdésein, ami 4,8 százalékpontos javulás a GPT-4o korábbi legjobb eredményéhez képest.
A GPT-5 70%-ot ért el a multimodális orvosi érvelési feladatokban, amelyek a betegtörténeteket képalkotó diagnosztikával ötvözik, ami közel 30 pontos növekedés a GPT-4o-hoz képest.
A rendszer a szakértői szintű teszteken 24%-kal szárnyalta túl a rezidens orvosokat az érvelésben, és 29%-kal a megértésben.
A GPT-5 kifinomult diagnosztikai képességeket mutatott összetett esetekben, laborértékek és CT-vizsgálatok alapján helyesen azonosítva olyan ritka állapotokat, mint a Boerhaave-szindróma.

Miért fontos?

A GPT-4o emberközeli teljesítményéről a GPT-5 orvosokat felülmúló képességeire való váltás azt mutatja, hogy közeledünk ahhoz a ponthoz, ahol az AI-t klinikai környezetben nem használó orvosokat mulasztással vádolhatják. Ezenkívül a szakadék csak tovább nő az intelligencia skálázódásával. ---

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

Termékképek precíz szerkesztése mesterséges intelligenciával

19 órája

MirrorCode Benchmark: Az AI rendszerek hetes nagyságrendű programozási feladatokat oldanak meg

1 napja

Az amerikai Genesis Mission kiválasztotta az első 278 AI tudományos projektet

4 napja

Tudj meg többet

AI a kutatásban és oktatásban: Hatékony irodalomkutatás és forráselemzés

OpenAI Sora: AI videógenerálás – minden, amit tudni kell