A Google DeepMind bemutatta a Med-PaLM Multimodal modellt a fejlett orvosbiológiai adatok értelmezéséhez
A Google DeepMind közzétette a Med-PaLM Multimodal-t, egy élvonalbeli orvosi AI-t, amely képes különféle orvosbiológiai adattípusok értelmezésére. Ez a modell túlmutat a szövegen: orvosi képalkotó és genomikai adatokat is feldolgoz. Bebizonyította, hogy képes nagy különbséggel felülmúlni a specializált modelleket, és meglepő zero-shot általánosítást mutat új orvosi koncepciók és feladatok terén.
- Szimultán értelmezi a nyelvi, orvosi képalkotó és genomikai adatokat
- Felülmúlja a meglévő specializált orvosi AI modelleket a diagnosztikai pontosságban
- Zero-shot általánosítást mutat olyan feladatoknál, amelyekre kifejezetten nem képezték ki
- Célja egy egységes AI asszisztens biztosítása a klinikai döntéshozatalhoz
Miért fontos?
A multimodális orvosi AI jelenti az egészségügy következő határvonalát, lehetőséget kínálva összetett, eltérő adatpontok szintetizálására, hogy pontosabb diagnózisokkal segítse a klinikusokat. ---
Kapcsolódó hírek
A Rhymes AI kiadta az Aria-t, az első nyílt forráskódú multimodális Mixture-of-Experts modellt
2024. október 17.
A Meta és a Waymo kidolgozta a Transfusion multimodális tanítási stratégiát
2024. augusztus 22.
A MiniCPM-V 2.6 valós idejű videóértelmezést tesz lehetővé mobileszközökön
2024. augusztus 8.