MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az Apple bemutatta a LazyLLM-et a gyorsított modell-következtetéshez

Az Apple kutatói kifejlesztették a LazyLLM-et, egy innovatív módszert, amely dinamikusan ritkítja (pruning) a tokeneket a nyelvi modellek inference folyamatának felgyorsítása érdekében. Ez a megközelítés megőrzi a modell pontosságát, miközben jelentősen csökkenti a számítási terhelést a kezdeti feldolgozási fázisban.
Eredeti forrás megtekintése (angol) →