MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

A PowerInfer-2 keretrendszer nagy sebességű LLM inference-t tesz lehetővé okostelefonokon

Kutatók bemutatták a PowerInfer-2-t, egy okostelefonokra tervezett, optimalizált inference keretrendszert. A rendszer támogatja a Mixtral 47B modelleket másodpercenként 11 token sebességgel, ami 22-szer gyorsabb a jelenlegi megoldásoknál.

Eredeti forrás megtekintése (angol) →
Kapcsolódó hírek
Az Apple bemutatja a GSM-Symbolic benchmarkot az LLM-ek matematikai érvelésének értékelésére
2024. október 17.
Az Anthropic Contextual Retrieval megoldása akár 49 százalékkal csökkenti a RAG hibákat
2024. szeptember 26.
A DeepMind SCoRe módszere külső felügyelet nélkül javítja az LLM-ek önjavító képességét
2024. szeptember 26.
Tudj meg többet
Nagy nyelvi modellek (LLM): Hogyan működnek a ChatGPT-féle rendszerek?