A Google DeepMind bemutatta a Med-PaLM Multimodal modellt a fejlett orvosbiológiai adatok értelmezéséhez

2023. július 29. · MI Történik? · 1 perc olvasás

A Google DeepMind közzétette a Med-PaLM Multimodal-t, egy élvonalbeli orvosi AI-t, amely képes különféle orvosbiológiai adattípusok értelmezésére. Ez a modell túlmutat a szövegen: orvosi képalkotó és genomikai adatokat is feldolgoz. Bebizonyította, hogy képes nagy különbséggel felülmúlni a specializált modelleket, és meglepő zero-shot általánosítást mutat új orvosi koncepciók és feladatok terén.

Szimultán értelmezi a nyelvi, orvosi képalkotó és genomikai adatokat
Felülmúlja a meglévő specializált orvosi AI modelleket a diagnosztikai pontosságban
Zero-shot általánosítást mutat olyan feladatoknál, amelyekre kifejezetten nem képezték ki
Célja egy egységes AI asszisztens biztosítása a klinikai döntéshozatalhoz

Miért fontos?

A multimodális orvosi AI jelenti az egészségügy következő határvonalát, lehetőséget kínálva összetett, eltérő adatpontok szintetizálására, hogy pontosabb diagnózisokkal segítse a klinikusokat. ---

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

A Rhymes AI kiadta az Aria-t, az első nyílt forráskódú multimodális Mixture-of-Experts modellt

2024. október 17.

A Meta és a Waymo kidolgozta a Transfusion multimodális tanítási stratégiát

2024. augusztus 22.

A MiniCPM-V 2.6 valós idejű videóértelmezést tesz lehetővé mobileszközökön

2024. augusztus 8.

Tudj meg többet

Perplexity AI: A Google-kereső AI-vel felturbózva

Gemini a Gmail-ben és a Google Docs-ban: Így automatizáld a munkád