MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

A DeepSeek bemutatta az Engramot az AI következtetés és a tudásfelidézés szétválasztására

A DeepSeek közzétett egy új tanulmányt „Engram” címmel, amely egy módszert javasol a következtetés (reasoning) és a felidézés (recall) szétválasztására. Ahelyett, hogy a GPU-t minden lekérdezésnél a tények újbóli levezetésére kényszerítené, a rendszer a statikus tudást az olcsóbb rendszer-RAM-ba helyezi el. Ez a megközelítés a KV cache problémát a tudás tárolásával kezeli a nyers kontextus helyett. Az adatok High Bandwidth Memory (HBM) memóriáról a szabványos rendszer-RAM-ra való áthelyezésével a modell nagyobb pontosságot tarthat fenn hosszú kontextusok esetén, miközben jelentősen csökkenti a működési költségeket.
Miért fontos?

Ha a DeepSeek megközelítése megállja a helyét éles környezetben is, az jelentős változást hozhat az AI-hardverek kihasználásában, pontosabbá és lényegesen olcsóbbá téve a hosszú kontextusú következtetést. ---

Eredeti forrás megtekintése (angol) →