KIEMELT HÍREK
A Mamba-2 sebességi rekordokat dönt és bevezeti az SSD keretrendszert a nyelvmodellezésben
A Princeton és a CMU kutatói közzétették a Mamba-2-t, egy jelentősen gyorsabb nyelvi modellt, amely megőrzi versenyképes teljesítményét a nyelvmodellezésben. A modellel együtt bemutatták a Structured State Space Duality (SSD) keretrendszert is, amely elméleti kapcsolatot teremt a State Space Modellek (SSM) és a Transformerek között.
- A korábbi verziókhoz képest jelentősen nagyobb feldolgozási sebességet ér el
- Megőrzi a versenyképes eredményeket a szabványos nyelvmodellezési teszteken
- Bevezeti az SSD keretrendszert az SSM-ek és Transformerek közötti szakadék áthidalására
- A Princeton és a CMU kutatói open-source projektként tették közzé
Miért fontos?
A Mamba-2 és az SSD keretrendszer olyan nyelvi modellek felé mutat utat, amelyek a jelenlegi Transformereknél sokkal hatékonyabbak, miközben megtartják azok érvelési képességeit. ---