Egy új megközelítés sokkal hatékonyabbá teheti az AI tanítását

2026. május 22. · MI Történik? · 2 perc olvasás

2027-re az AI-ipar várhatóan évente nagyjából annyi energiát emészt fel, mint Hollandia teljes fogyasztása. A felhasználók sem mentesülnek a felelősség alól: egy átlagos ChatGPT-munkamenet akár fél liter vizet is igényelhet, amit gyakran az adatközpontok hűtésére használnak.

A probléma megoldására a Microsoft az atomfúziós technológián dolgozik, míg az Alphabet olyan projekteket finanszíroz, amelyek több ezer láb mélyre fúrnak a földbe geotermikus energia után kutatva. Környezetvédők szerint azonban ezeknek a „mentőöv-megoldásoknak” kevés esélyük van a sikerre – legalábbis a következő néhány évben.

Fenntarthatóbb megközelítés lehet az AI modellek működési elvének alapvető megváltoztatása. A University of California, Santa Cruz kutatói éppen most mutattak be egy ígéretes módszert, amely átalakíthatja az AI cégek LLM-oktatási folyamatait.

Így működik: A mai modellek többsége egy energiaigényes folyamatra, a mátrixszorzásra (MatMul) támaszkodik, ami – ahogy a név is sugallja – számok szorzását jelenti a hálózat több rétegén keresztül. Ezek a számok gyakran tizedesjegyeket tartalmaznak, ami megnehezíti a folyamat minden egyes lépésének kiszámítását.

A Santa Cruz-i számítástechnikusok azonban találtak egy módszert ezeknek a számoknak ternáris (hármas) értékekre való átalakítására. (A bináris rendszer helyett, amely 0-kat és 1-eseket használ, a ternáris a -1-et is hozzáadja a rendszerbe.) Ez minden számítást sokkal egyszerűbbé tesz, mivel a számítógépnek egyszerre csak három opcióval kell foglalkoznia, és szorzás helyett összeadást végezhet.

Mennyi energiát takaríthat meg ez a megközelítés? A kutatók szerint egy egymilliárd paraméteres, Llama-2-höz hasonló modellt mindössze 13 wattos teljesítménnyel tudtak futtatni – ami egy LED-izzó fogyasztásának felel meg. Mindezt a teljesítmény jelentős romlása nélkül érték el.

Az olyan tech cégek, mint az OpenAI, már a billió-paraméteres modellek felé mozdulnak el, amelyekkel ez a megközelítés még nem kompatibilis. A kutatók azonban azt mondják, hogy képesek lesznek felskálázni a módszerüket, és az akár az AI cégek már meglévő hardvereihez is hozzáigazítható.

Az AI-ipar energiafogyasztása az előrejelzések szerint 2027-re eléri Hollandia szintjét.
Egy átlagos ChatGPT-munkamenet körülbelül fél liter vizet fogyaszt el hűtési célokra.
A kutatók a mátrixszorzást (MatMul) ternáris értékekkel (-1, 0, 1) helyettesítették.
Az új módszer lehetővé teszi a számítógépek számára, hogy bonyolult szorzás helyett összeadást végezzenek.
Egy egymilliárd paraméteres, Llama-2-höz hasonló modellt mindössze 13 watt energiával futtattak.
A módszer nem mutatott jelentős teljesítménycsökkenést a hagyományos, energiaigényes tanításhoz képest.

Miért fontos?

Fenntarthatóbb megközelítés lehet az AI modellek működési elvének alapvető megváltoztatása. A University of California, Santa Cruz kutatói egy olyan ígéretes módszert mutattak be, amely alapjaiban alakíthatja át az AI cégek LLM-oktatási módszereit. ---

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

A Big Tech vállalatok érdeklődnek az OpenAI legújabb, 100 milliárd dolláros finanszírozási köre iránt

2026. május 24.

A Black Forest Labs elindította FLUX 1 csomagját a piacvezető képgenerátorok kihívójaként

2026. május 24.

Vita az internetes adatokat lekaparó AI-cégek körül

2026. május 24.