MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

A PETALS lehetővé teszi az elosztott LLM-inferenciát és finomhangolást az interneten keresztül

A Yandex, a Neiro.ai, a University of Washington és a Hugging Face kutatói kifejlesztették a PETALS-t, egy olyan rendszert, amely megkönnyíti az ad-hoc kollektívák számára a számítási erőforrások megosztását a nagy nyelvi modellek futtatásához és finomhangolásához. A technika lehetővé teszi a szupercomputer-hozzáféréssel nem rendelkező kisebb csoportok számára, hogy 50 milliárdnál is több paraméterrel rendelkező modelleket futtassanak, mint például a Llama 2 (70B) és a BLOOM (176B). A PETALS a transformer blokkokat távoli szerverekre delegálja, miközben a kliens csak minimális beágyazásokat (embeddings) tárol, ami heterogén és megbízhatatlan hálózati környezetben felülmúlja a helyi RAM-alapú offloading megoldásokat.
Miért fontos?

A legtöbb AI-irányelv központosított tanítást és kiszolgálást feltételez. A PETALS megmutatja, hogy a nagy modellek decentralizált, ad-hoc hardvergyűjteményeken keresztül is kiszolgálhatók és adaptálhatók, ami jelentősen megnehezíti a modellek feletti ellenőrzést, és nagyobb mozgásteret ad az egyéni kutatóknak. ---

Eredeti forrás megtekintése (angol) →