MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

A Meta négy új open-source AI modellt és kutatási eszközt tett közzé

A Meta Fundamental AI Research (FAIR) csoportja a napokban egy jelentős csomagot tett közzé, amely négy új, open-source AI modellt és kutatási eszközt tartalmaz. A kezdeményezés célja, hogy tovább támogassa az iparági kutatásokat és fejlessze a multimodális képességeket, valamint az audió generálás területeit. A kiadott eszközök között találhatók olyan megoldások, amelyek a szöveg, kép és hang együttes kezelésére képesek, de érkezett speciális, zenegenerálást segítő modell, valamint egy rendkívül fontos vízjelező technológia is, amely az AI által generált beszéd azonosítását hivatott megkönnyíteni.

A közölt fejlesztések közül kiemelkedik a Chameleon, egy 7B és 34B paraméterrel rendelkező nyelvi modellcsalád, amely a korábbi májusi bemutatója óta nagy várakozásokat váltott ki. Ez a rendszer azért különleges, mert natív módon képes egyszerre kezelni kép-, hang- és szöveges bemeneteket, ami sokkal természetesebb és rugalmasabb interakciót tesz lehetővé az AI rendszerekkel. Szintén figyelemre méltó a JASCO modell, amely a szöveg-zene generálás világába hoz újdonságot: ez a technológia az eddigieknél jóval részletesebb és precízebb vezérlést tesz lehetővé a zenék létrehozása során, ami komoly előrelépést jelent a kreatív AI eszközök piacán.

A technikai repertoárt tovább bővíti a Multi-Token Prediction modell, amely a szoftverfejlesztők munkáját hivatott megkönnyíteni. Ez a rendszer a kódkiegészítés hatékonyságát növeli azáltal, hogy a hagyományos módszerekkel ellentétben egyszerre több tokent jelez előre. Ezzel a fejlesztéssel nem csupán a generálás sebessége növelhető, hanem a kód minősége és az AI képességei is javulnak komplex programozási feladatok esetén.

Az újítások közül talán az AudioSeal a legfontosabb az iparági biztonság és transzparencia szempontjából. Ez az első olyan audió vízjelezési modell, amelyet kifejezetten az AI által generált beszéd felismerésére fejlesztettek ki, és amelyet a Meta kereskedelmi licenc alatt bocsátott rendelkezésre. Tekintettel arra, hogy az iparág jelenleg mennyire küzd a különböző AI által generált tartalmak, például szövegek és képek megbízható azonosításával, az AudioSeal egy hiánypótló technológia lehet. A Meta ezzel a lépéssel nemcsak a kutatási szekér mozgását gyorsítja, hanem a generatív AI térnyerésével járó biztonsági kihívásokra is kézzelfogható választ kínál.

Miért fontos?

A Meta ismét rengeteg új open-source újdonságot tett elérhetővé, tovább mozdítva az AI kutatások szekerét. Az AudioSeal AI-hangfelismerése különösen érdekes lesz, figyelembe véve, hogy az iparág mennyire küzd más tartalmak, például szövegek és képek megbízható azonosításával.

Eredeti forrás megtekintése (angol) →
Kapcsolódó hírek
A Meta megkezdte saját AI oktató chipjének tesztelését az Nvidia-függőség csökkentése érdekében
2026. május 24.
A Meta célba veszi a humanoid robotika fejlesztését
2026. május 24.
A Meta AI által generált profilokat és karaktereket mutatott be a Facebook-aktivitás növelésére
2026. május 23.