MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az MIT bemutatta a DuoAttention keretrendszert az LLM memóriahasználatának 2,5-szeres csökkentésére

Az MIT kutatói nyílt forráskódúvá tették a DuoAttentiont, egy olyan keretrendszert, amely optimalizálja a KV (Key-Value) gyorsítótárazást a memóriaigény csökkentése érdekében. Azáltal, hogy azonosítja, mely attention head-ek igényelnek teljes kontextust és melyek nyeshetők le, a rendszer hatékonyabbá teszi a hosszú szekvenciák feldolgozását.
Miért fontos?

A memóriakorlátok jelentik a legfőbb akadályt a hosszú kontextusú LLM-ek alkalmazásánál. A DuoAttention utat mutat az erősebb modellek szerényebb hardvereken való futtatásához. ---

Eredeti forrás megtekintése (angol) →