A Meta megjelentette a CM3leon multimodális generatív AI-t szöveghez és képekhez

2023. július 17. · MI Történik? · 1 perc olvasás

A Meta nemrég mutatta be a CM3leont, új generatív AI modelljét, amely szövegből képet és képből szöveget is képes generálni.

Képes szöveg- és képsorozatokat generálni bármely megadott kép- és szövegtartalom alapján
A szövegből-kép generálási teljesítmény ötször kevesebb számítási kapacitást igényel, mint a korábbi transformer-alapú módszerek
Képaláírásokat készít és megválaszol bármilyen képpel kapcsolatos kérdést
Ez az első multimodális modell, amelyet kizárólag szöveges nyelvi modellekből származó módszerrel tanítottak

Miért fontos?

Annak ellenére, hogy kisebb adathalmazon tanították (3 milliárd token), a teljesítménye összemérhető a nagyobb modellekével. A Meta mostanában nagyon belehúzott az AI fejlesztésekbe.

Eredeti forrás megtekintése (angol) →