A Meta négy új open-source AI modellt és kutatási eszközt tett közzé

2026. május 23. · MI Történik? · 2 perc olvasás

A Meta Fundamental AI Research (FAIR) csoportja a napokban egy jelentős csomagot tett közzé, amely négy új, open-source AI modellt és kutatási eszközt tartalmaz. A kezdeményezés célja, hogy tovább támogassa az iparági kutatásokat és fejlessze a multimodális képességeket, valamint az audió generálás területeit. A kiadott eszközök között találhatók olyan megoldások, amelyek a szöveg, kép és hang együttes kezelésére képesek, de érkezett speciális, zenegenerálást segítő modell, valamint egy rendkívül fontos vízjelező technológia is, amely az AI által generált beszéd azonosítását hivatott megkönnyíteni.

A közölt fejlesztések közül kiemelkedik a Chameleon, egy 7B és 34B paraméterrel rendelkező nyelvi modellcsalád, amely a korábbi májusi bemutatója óta nagy várakozásokat váltott ki. Ez a rendszer azért különleges, mert natív módon képes egyszerre kezelni kép-, hang- és szöveges bemeneteket, ami sokkal természetesebb és rugalmasabb interakciót tesz lehetővé az AI rendszerekkel. Szintén figyelemre méltó a JASCO modell, amely a szöveg-zene generálás világába hoz újdonságot: ez a technológia az eddigieknél jóval részletesebb és precízebb vezérlést tesz lehetővé a zenék létrehozása során, ami komoly előrelépést jelent a kreatív AI eszközök piacán.

A technikai repertoárt tovább bővíti a Multi-Token Prediction modell, amely a szoftverfejlesztők munkáját hivatott megkönnyíteni. Ez a rendszer a kódkiegészítés hatékonyságát növeli azáltal, hogy a hagyományos módszerekkel ellentétben egyszerre több tokent jelez előre. Ezzel a fejlesztéssel nem csupán a generálás sebessége növelhető, hanem a kód minősége és az AI képességei is javulnak komplex programozási feladatok esetén.

Az újítások közül talán az AudioSeal a legfontosabb az iparági biztonság és transzparencia szempontjából. Ez az első olyan audió vízjelezési modell, amelyet kifejezetten az AI által generált beszéd felismerésére fejlesztettek ki, és amelyet a Meta kereskedelmi licenc alatt bocsátott rendelkezésre. Tekintettel arra, hogy az iparág jelenleg mennyire küzd a különböző AI által generált tartalmak, például szövegek és képek megbízható azonosításával, az AudioSeal egy hiánypótló technológia lehet. A Meta ezzel a lépéssel nemcsak a kutatási szekér mozgását gyorsítja, hanem a generatív AI térnyerésével járó biztonsági kihívásokra is kézzelfogható választ kínál.

A Chameleon egy nyelvi modellcsalád (7B és 34B paraméterrel), amely képes egyszerre kezelni kép-, hang- és szöveges bemeneteket – korábban májusban mutatták be.
A JASCO a Meta új, irányítható szöveg-zene modellje, amely részletes vezérlést tesz lehetővé a zenegenerálás során.
Az AudioSeal az első olyan audió vízjelezési modell, amelyet kifejezetten az AI által generált beszéd felismerésére fejlesztettek ki, és kereskedelmi licenc alatt tették közzé.
A Meta Multi-Token Prediction modellje a kódkiegészítést célozza javítani azáltal, hogy egyszerre több tokent jelez előre, növelve a sebességet és a képességeket.

Miért fontos?

A Meta ismét rengeteg új open-source újdonságot tett elérhetővé, tovább mozdítva az AI kutatások szekerét. Az AudioSeal AI-hangfelismerése különösen érdekes lesz, figyelembe véve, hogy az iparág mennyire küzd más tartalmak, például szövegek és képek megbízható azonosításával.

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

A Meta folytatja a Muse Spark 1.1 fejlesztését

5 napja

A Meta közzétette a Muse Image és a Muse Video előzetesét

2026. július 9.

A Meta a GPT-5.5 szintjét elérő „Watermelon” modellen dolgozik

2026. július 6.