Egy új megközelítés sokkal hatékonyabbá teheti az AI tanítását
2027-re az AI-ipar várhatóan évente nagyjából annyi energiát emészt fel, mint Hollandia teljes fogyasztása. A felhasználók sem mentesülnek a felelősség alól: egy átlagos ChatGPT-munkamenet akár fél liter vizet is igényelhet, amit gyakran az adatközpontok hűtésére használnak.
A probléma megoldására a Microsoft az atomfúziós technológián dolgozik, míg az Alphabet olyan projekteket finanszíroz, amelyek több ezer láb mélyre fúrnak a földbe geotermikus energia után kutatva. Környezetvédők szerint azonban ezeknek a „mentőöv-megoldásoknak” kevés esélyük van a sikerre – legalábbis a következő néhány évben.
Fenntarthatóbb megközelítés lehet az AI modellek működési elvének alapvető megváltoztatása. A University of California, Santa Cruz kutatói éppen most mutattak be egy ígéretes módszert, amely átalakíthatja az AI cégek LLM-oktatási folyamatait.
Így működik: A mai modellek többsége egy energiaigényes folyamatra, a mátrixszorzásra (MatMul) támaszkodik, ami – ahogy a név is sugallja – számok szorzását jelenti a hálózat több rétegén keresztül. Ezek a számok gyakran tizedesjegyeket tartalmaznak, ami megnehezíti a folyamat minden egyes lépésének kiszámítását.
A Santa Cruz-i számítástechnikusok azonban találtak egy módszert ezeknek a számoknak ternáris (hármas) értékekre való átalakítására. (A bináris rendszer helyett, amely 0-kat és 1-eseket használ, a ternáris a -1-et is hozzáadja a rendszerbe.) Ez minden számítást sokkal egyszerűbbé tesz, mivel a számítógépnek egyszerre csak három opcióval kell foglalkoznia, és szorzás helyett összeadást végezhet.
Mennyi energiát takaríthat meg ez a megközelítés? A kutatók szerint egy egymilliárd paraméteres, Llama-2-höz hasonló modellt mindössze 13 wattos teljesítménnyel tudtak futtatni – ami egy LED-izzó fogyasztásának felel meg. Mindezt a teljesítmény jelentős romlása nélkül érték el.
Az olyan tech cégek, mint az OpenAI, már a billió-paraméteres modellek felé mozdulnak el, amelyekkel ez a megközelítés még nem kompatibilis. A kutatók azonban azt mondják, hogy képesek lesznek felskálázni a módszerüket, és az akár az AI cégek már meglévő hardvereihez is hozzáigazítható.
- Az AI-ipar energiafogyasztása az előrejelzések szerint 2027-re eléri Hollandia szintjét.
- Egy átlagos ChatGPT-munkamenet körülbelül fél liter vizet fogyaszt el hűtési célokra.
- A kutatók a mátrixszorzást (MatMul) ternáris értékekkel (-1, 0, 1) helyettesítették.
- Az új módszer lehetővé teszi a számítógépek számára, hogy bonyolult szorzás helyett összeadást végezzenek.
- Egy egymilliárd paraméteres, Llama-2-höz hasonló modellt mindössze 13 watt energiával futtattak.
- A módszer nem mutatott jelentős teljesítménycsökkenést a hagyományos, energiaigényes tanításhoz képest.
Fenntarthatóbb megközelítés lehet az AI modellek működési elvének alapvető megváltoztatása. A University of California, Santa Cruz kutatói egy olyan ígéretes módszert mutattak be, amely alapjaiban alakíthatja át az AI cégek LLM-oktatási módszereit. ---