MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Bemutatkozott az Inception Labs Mercury 2 modellje: 10-szer gyorsabb, diffúzió-alapú szöveges modell

Stefano Ermon, a Stanford professzora – aki a Midjourney és a Sora mögött álló diffúziós technológia feltalálója – ugyanezeket az elveket alkalmazta a szöveggenerálásban is. Cége, az Inception Labs, kiadta a Mercury 2-t, egy olyan reasoning modellt, amely másodpercenként 1000 tokent generál. A hagyományos LLM architektúráktól eltérve és a diffúziót szövegre alkalmazva a modell lényegesen nagyobb sebességet ér el alacsonyabb költségek mellett, mint a fő versenytársak, például a ChatGPT vagy a Claude.
Miért fontos?

Ez az áttörés azt sugallja, hogy az AI teljesítményének következő ugrása a modellek "gondolkodásának" és szöveggenerálásának alapvető architektúrális megváltoztatásából adódhat, ami a nagy sebességű reasoning folyamatokat sokkal olcsóbban elérhetővé teheti.

Eredeti forrás megtekintése (angol) →