MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Egy új megközelítés sokkal hatékonyabbá teheti az AI tanítását

2027-re az AI-ipar várhatóan évente nagyjából annyi energiát emészt fel, mint Hollandia teljes fogyasztása. A felhasználók sem mentesülnek a felelősség alól: egy átlagos ChatGPT-munkamenet akár fél liter vizet is igényelhet, amit gyakran az adatközpontok hűtésére használnak.

A probléma megoldására a Microsoft az atomfúziós technológián dolgozik, míg az Alphabet olyan projekteket finanszíroz, amelyek több ezer láb mélyre fúrnak a földbe geotermikus energia után kutatva. Környezetvédők szerint azonban ezeknek a „mentőöv-megoldásoknak” kevés esélyük van a sikerre – legalábbis a következő néhány évben.

Fenntarthatóbb megközelítés lehet az AI modellek működési elvének alapvető megváltoztatása. A University of California, Santa Cruz kutatói éppen most mutattak be egy ígéretes módszert, amely átalakíthatja az AI cégek LLM-oktatási folyamatait.

Így működik: A mai modellek többsége egy energiaigényes folyamatra, a mátrixszorzásra (MatMul) támaszkodik, ami – ahogy a név is sugallja – számok szorzását jelenti a hálózat több rétegén keresztül. Ezek a számok gyakran tizedesjegyeket tartalmaznak, ami megnehezíti a folyamat minden egyes lépésének kiszámítását.

A Santa Cruz-i számítástechnikusok azonban találtak egy módszert ezeknek a számoknak ternáris (hármas) értékekre való átalakítására. (A bináris rendszer helyett, amely 0-kat és 1-eseket használ, a ternáris a -1-et is hozzáadja a rendszerbe.) Ez minden számítást sokkal egyszerűbbé tesz, mivel a számítógépnek egyszerre csak három opcióval kell foglalkoznia, és szorzás helyett összeadást végezhet.

Mennyi energiát takaríthat meg ez a megközelítés? A kutatók szerint egy egymilliárd paraméteres, Llama-2-höz hasonló modellt mindössze 13 wattos teljesítménnyel tudtak futtatni – ami egy LED-izzó fogyasztásának felel meg. Mindezt a teljesítmény jelentős romlása nélkül érték el.

Az olyan tech cégek, mint az OpenAI, már a billió-paraméteres modellek felé mozdulnak el, amelyekkel ez a megközelítés még nem kompatibilis. A kutatók azonban azt mondják, hogy képesek lesznek felskálázni a módszerüket, és az akár az AI cégek már meglévő hardvereihez is hozzáigazítható.

Miért fontos?

Fenntarthatóbb megközelítés lehet az AI modellek működési elvének alapvető megváltoztatása. A University of California, Santa Cruz kutatói egy olyan ígéretes módszert mutattak be, amely alapjaiban alakíthatja át az AI cégek LLM-oktatási módszereit. ---

Eredeti forrás megtekintése (angol) →
Kapcsolódó hírek
A Big Tech vállalatok érdeklődnek az OpenAI legújabb, 100 milliárd dolláros finanszírozási köre iránt
2026. május 24.
A Black Forest Labs elindította FLUX 1 csomagját a piacvezető képgenerátorok kihívójaként
2026. május 24.
Vita az internetes adatokat lekaparó AI-cégek körül
2026. május 24.