AI RESEARCH
Bemutatkozott az Inception Labs Mercury 2 modellje: 10-szer gyorsabb, diffúzió-alapú szöveges modell
Stefano Ermon, a Stanford professzora – aki a Midjourney és a Sora mögött álló diffúziós technológia feltalálója – ugyanezeket az elveket alkalmazta a szöveggenerálásban is. Cége, az Inception Labs, kiadta a Mercury 2-t, egy olyan reasoning modellt, amely másodpercenként 1000 tokent generál. A hagyományos LLM architektúráktól eltérve és a diffúziót szövegre alkalmazva a modell lényegesen nagyobb sebességet ér el alacsonyabb költségek mellett, mint a fő versenytársak, például a ChatGPT vagy a Claude.
- Stefano Ermon, a diffúziós modellek úttörője fejlesztette ki.
- Másodpercenként 1000 token sebességgel generál szöveget.
- A hagyományos reasoning modellek költségének töredékéért működik.
- Alapvető változást jelent a szöveggenerálás módjában a standard LLM-ekhez képest.
Miért fontos?
Ez az áttörés azt sugallja, hogy az AI teljesítményének következő ugrása a modellek "gondolkodásának" és szöveggenerálásának alapvető architektúrális megváltoztatásából adódhat, ami a nagy sebességű reasoning folyamatokat sokkal olcsóbban elérhetővé teheti.