AI KUTATÁS
Az OpenAI GPT-5 modellje túlszárnyalja az orvosokat a komplex orvosi érvelési vizsgákon
Az OpenAI GPT-5 lenyűgöző eredményeket ért el az orvosi érvelési benchmarkokon, az Emory University új tanulmánya szerint jelentős különbséggel előzte meg a GPT-4o-t és az egészségügyi szakembereket a diagnosztikai és multimodális feladatokban.
- A modell 95,84%-os pontosságot ért el a MedQA klinikai kérdésein, ami 4,8 százalékpontos javulás a GPT-4o korábbi legjobb eredményéhez képest.
- A GPT-5 70%-ot ért el a multimodális orvosi érvelési feladatokban, amelyek a betegtörténeteket képalkotó diagnosztikával ötvözik, ami közel 30 pontos növekedés a GPT-4o-hoz képest.
- A rendszer a szakértői szintű teszteken 24%-kal szárnyalta túl a rezidens orvosokat az érvelésben, és 29%-kal a megértésben.
- A GPT-5 kifinomult diagnosztikai képességeket mutatott összetett esetekben, laborértékek és CT-vizsgálatok alapján helyesen azonosítva olyan ritka állapotokat, mint a Boerhaave-szindróma.
Miért fontos?
A GPT-4o emberközeli teljesítményéről a GPT-5 orvosokat felülmúló képességeire való váltás azt mutatja, hogy közeledünk ahhoz a ponthoz, ahol az AI-t klinikai környezetben nem használó orvosokat mulasztással vádolhatják. Ezenkívül a szakadék csak tovább nő az intelligencia skálázódásával. ---