Az Inception Labs elindította az ultra-gyors Mercury diffúziós modellt szöveghez

2026. május 24. · MI Történik? · 3 perc olvasás

Az Inception Labs nevű tech startup hivatalosan is kilépett a rejtőzködő, úgynevezett stealth üzemmódból, és azonnal egy komoly áttörést jelentő bejelentéssel hívta fel magára a piac figyelmét. A vállalat bemutatta a Mercury nevű ultra-gyors generatív modellt, amely egy teljesen új megközelítést alkalmaz a szöveggenerálás terén. A Mercury egy egyedülálló text-diffusion, azaz diffúziós alapú LLM, amely képes a hagyományos nagy nyelvi modellekhez képest akár tízszer gyorsabban szöveget előállítani. A rendkívüli sebességnövekedés ráadásul egyáltalán nem jár a minőség romlásával, hiszen a modell a tesztek során standard H100-as chipeken futtatva képes volt elérni a másodpercenkénti több mint 1000 tokenes generálási sebességet, miközben tökéletesen hozza a megszokott piaci színvonalat.

Az Inception Labs technológiájának hátterében egy alapvető paradigmaváltás áll, amely megváltoztatja azt, amit eddig az AI nyelvi generálási mechanizmusáról gondoltunk. Miközben a jelenleg elterjedt hagyományos LLM-ek szekvenciálisan, azaz szigorúan egymás után, egyszerre csak egyetlen tokent generálnak, addig a Mercury innovatív diffúziós megközelítése lehetővé teszi, hogy teljes szövegblokkokat hozzon létre párhuzamosan. Ez a módszer drasztikusan növeli a generálás sebességét, miközben sokkal jobb hatékonyságot és nagyobb kontrollt biztosít a folyamatok felett. A startup első gyakorlati fejlesztése a Mercury Coder nevű modell, amely kifejezetten a kódgenerálásra fókuszál. A Mercury Coder kódolási teljesítménye teljesen megegyezik, vagy bizonyos esetekben felül is múlja az olyan népszerű és elismert modellek szintjét, mint az OpenAI-féle GPT-4o Mini vagy az Anthropic által fejlesztett Claude 3.5 Haiku, mindezt azonban az említett versenytársakhoz képest ötszörös vagy akár tízszeres sebesség mellett valósítja meg.

A forradalmi technológia kidolgozása mögött komoly tudományos munka áll, hiszen az Inception Labs alapítója Stefano Ermon, a Stanford professzora. A kutató hosszú időn keresztül azt tanulmányozta, miként lehetne a diffúziós eljárást – amelyet eddig szinte kizárólag olyan kép- és videógeneráló rendszereknél láthattunk sikeresen működni, mint például a Sora – hatékonyan átültetni a szöveges tartalomgyártás világába. Az eredmények azt mutatják, hogy a Mercury modellek közvetlen és zökkenőmentes helyettesítőként szolgálhatnak a hagyományos modellek helyett olyan kritikus fontosságú vállalati területeken, mint a kódgenerálás, az ügyfélszolgálati rendszerek és a komplex vállalati automatizáció. Ez a fejlemény azért rendkívül fontos, mert alapjaiban kérdőjelezi meg az AI nyelvi generálásáról alkotott eddigi alapvető feltételezéseinket. A technika elterjedésével sokkal erősebb és autonómabb AI ágensek hozhatók létre, javul a következtetési folyamatok hatékonysága, a felhasználók számára pedig olyan AI élményeket tesz lehetővé, amelyek valós időben futva valóban teljesen pillanatszerűnek érződnek.

Az LLM-ek egyszerre egy tokent generálnak, de a Mercury diffúziós megközelítése teljes blokkokat generál párhuzamosan a nagyobb sebesség, hatékonyság és kontroll érdekében.
Első modelljük, a Mercury Coder, megegyezik az olyan modellek kódolási teljesítményével, vagy felülmúlja azokat, mint a GPT-4o Mini és a Claude 3.5 Haiku, mindezt 5-10-szeres sebességgel.
Az Inception-t a Stanford professzora, Stefano Ermon alapította, aki azt kutatta, hogyan lehet a diffúziót (amelyet általában kép- és videógenerálásra használnak) alkalmazni a szövegre.
A Mercury modellek közvetlen helyettesítőként szolgálhatnak a hagyományos modellekhez olyan területeken, mint a kódgenerálás, az ügyfélszolgálat és a vállalati automatizálás.

Miért fontos?

A „Sora-szerű” diffúzió szövegre történő átültetésével az Inception szembemegy az alapvető feltételezésekkel arról, hogyan kellene az AI-nak nyelvet generálnia. Technikája potenciálisan erősebb ágenseket (agents), jobb és hatékonyabb következtetést, valamint olyan AI élményeket tehet lehetővé, amelyek valóban pillanatszerűnek tűnnek.

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

GPT-5.6 prompting útmutató és új, képernyő-tudatos AI frissítések

6 órája

A HP mesterséges intelligenciája előre jelzi és elhárítja a hardverhibákat

9 órája

AI-ügynökök tanítása szakértői korrekciók alapján

9 órája

Tudj meg többet

AI hanggenerálás és zeneszerzés: Útmutató a Suno, Udio és ElevenLabs használatához