MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Új, élvonalbeli nyelvi modellek a láthatáron

A héten több új, csúcskategóriás nyelvi modell is megjelent, közülük is legfontosabb a Together AI StripedHyena-7B modellje. Ez a modell elmozdulást jelent a tisztán Transformer architektúráktól, egy hibrid kialakítást használva, amely ötvözi a multi-head attention technológiát a gated convolution megoldásokkal.

A hagyományos Transformer korlátain túllépve a StripedHyena nagyobb hatékonyságot és jobb teljesítményt ér el a hosszú kontextust igénylő feladatokban a Llama 2 7B és a Mistral 7B modellekhez képest. Ezek a megjelenések rávilágítanak az építészeti innováció növekvő trendjére, amely a nagy teljesítményű AI számítási költségeinek csökkentését célozza.

Miért fontos?

A StripedHyena-nál látható architektúrális váltások arra utalnak, hogy az AI következő generációja túlléphet a "csak Transformer" paradigmán a jobb skálázhatóság és hatékonyság érdekében. ---

Eredeti forrás megtekintése (angol) →
Kapcsolódó hírek
Boston Dynamics Spot robotok járőröznek a 2026-os FIFA Világbajnokság stadionjaiban
1 órája
Az AI pályára lép a labdarúgás legnagyobb színpadán
3 órája
Az XPeng vezérigazgatója irányítja a humanoid robotok sorozatgyártását
5 órája
Tudj meg többet
Nagy nyelvi modellek (LLM): Hogyan működnek a ChatGPT-féle rendszerek?