A PowerInfer-2 keretrendszer nagy sebességű LLM inference-t tesz lehetővé okostelefonokon

2024. június 20. · MI Történik? · 1 perc olvasás

Kutatók bemutatták a PowerInfer-2-t, egy okostelefonokra tervezett, optimalizált inference keretrendszert. A rendszer támogatja a Mixtral 47B modelleket másodpercenként 11 token sebességgel, ami 22-szer gyorsabb a jelenlegi megoldásoknál.

Kifejezetten mobilkészülékeken történő inference-re optimalizálva
Támogatja a nagy méretű modelleket, mint például a Mixtral 47B-t
Másodpercenként 11 tokenes feldolgozási sebességet ér el
22-szer gyorsabb a jelenlegi okostelefonos inference keretrendszereknél

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

Az Apple bemutatja a GSM-Symbolic benchmarkot az LLM-ek matematikai érvelésének értékelésére

2024. október 17.

Az Anthropic Contextual Retrieval megoldása akár 49 százalékkal csökkenti a RAG hibákat

2024. szeptember 26.

A DeepMind SCoRe módszere külső felügyelet nélkül javítja az LLM-ek önjavító képességét

2024. szeptember 26.

Tudj meg többet

Nagy nyelvi modellek (LLM): Hogyan működnek a ChatGPT-féle rendszerek?