MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

A Mamba-2 sebességi rekordokat dönt és bevezeti az SSD keretrendszert a nyelvmodellezésben

A Princeton és a CMU kutatói közzétették a Mamba-2-t, egy jelentősen gyorsabb nyelvi modellt, amely megőrzi versenyképes teljesítményét a nyelvmodellezésben. A modellel együtt bemutatták a Structured State Space Duality (SSD) keretrendszert is, amely elméleti kapcsolatot teremt a State Space Modellek (SSM) és a Transformerek között.
Miért fontos?

A Mamba-2 és az SSD keretrendszer olyan nyelvi modellek felé mutat utat, amelyek a jelenlegi Transformereknél sokkal hatékonyabbak, miközben megtartják azok érvelési képességeit. ---

Eredeti forrás megtekintése (angol) →