MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Diffúziós modellek: Az AI, amely 10-szer gyorsabban ír, mint a ChatGPT

Az AWS re:Invent 2025-ön készült interjúban Corey Stefano Ermonnal, az Inception Labs vezérigazgatójával és társalapítójával beszélget a Mercury-ról. Ez egy gyökeresen másfajta nyelvi modell, amely elhagyja a hagyományos autoregresszív megközelítést (egy-egy szó generálása egyszerre) egy diffúzió-alapú rendszer javára (szeretné tudni, mit jelent ez? Nézze meg a videót!). Minden nagy AI labor ugyanazt a típusú nyelvi modellt építi. Az OpenAI, az Anthropic, a Google: mindannyian autoregresszív transzformereket használnak, amelyek szavanként generálják a szöveget. Stefano Ermon szerint ez tévút. Cége pedig éppen most gyűjtött össze 50 millió dollárt az OpenAI és az Anthropic korai befektetőitől, a Microsofttól, az NVIDIA-tól és Andrej Karpathy-tól, hogy ezt bebizonyítsa.
Miért fontos?

Ha az Inception Labs-nek igaza van, akkor egy alapvető architektúra-váltás kezdetét látjuk az AI-ban: a szekvenciális token-jóslástól a párhuzamos, iteratív finomítás felé. Azokban az alkalmazásokban, ahol a sebesség számít (hangalapú ágensek, kódoló asszisztensek, valós idejű chat), a diffúziós modellek jelenthetik a megoldást, amit mindenki keresett. ---

Eredeti forrás megtekintése (angol) →