META
A Meta megjelentette a CM3leon multimodális generatív AI-t szöveghez és képekhez
A Meta nemrég mutatta be a CM3leont, új generatív AI modelljét, amely szövegből képet és képből szöveget is képes generálni.
- Képes szöveg- és képsorozatokat generálni bármely megadott kép- és szövegtartalom alapján
- A szövegből-kép generálási teljesítmény ötször kevesebb számítási kapacitást igényel, mint a korábbi transformer-alapú módszerek
- Képaláírásokat készít és megválaszol bármilyen képpel kapcsolatos kérdést
- Ez az első multimodális modell, amelyet kizárólag szöveges nyelvi modellekből származó módszerrel tanítottak
Miért fontos?
Annak ellenére, hogy kisebb adathalmazon tanították (3 milliárd token), a teljesítménye összemérhető a nagyobb modellekével. A Meta mostanában nagyon belehúzott az AI fejlesztésekbe.