MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

A Stanford és a Together.AI az "Intelligencia per Watt" mutatóval méri az Edge AI teljesítményét

A nagy nyelvi modellek iránti várható kereslet masszív adatközpont-építéseket ösztönöz. A kutatók azt vizsgálták, hogy a helyi eszközökön futó kisebb modellek érdemben könnyíthetnének-e ezen a terhelésen. Újdonság: Jon Saad-Falcon, Avanika Narayan és kollégáik a Stanford Egyetemen és a Together AI-nál (szoftverfejlesztő és tréning szolgáltató) megállapították, hogy a laptopok egyre inkább képesek helyettesíteni a felhőalapú számítástechnikát egy általuk "intelligencia per watt"-nak nevezett mutató alapján. Kulcsfontosságú felismerés: A felhőrendszerek jellemzően energiahatékonyabbak felhasználónként, mint a helyi rendszerek, de a kisebb, nagy teljesítményű modellek egyre inkább lehetővé teszik a helyi rendszerek hatékonyabb futtatását. Egy korábbi korszakban a feldolgozás akkor tolódott el a nagygépektől a személyi számítógépek felé, amikor a PC-k képesek voltak elég jól teljesíteni azonos vagy kevesebb energiafelhasználás mellett. Hasonlóképpen, az AI feladatok átkerülhetnek az adatközpontokból a személyi eszközökre, ha a laptopokon futó kisebb modellek elegendő pontosságot nyújtanak kevesebb lekérdezésenkénti energiafelhasználással. A helyi és a felhőalapú számítástechnika életképességét az intelligencia per watt kiszámításával mérhetjük: az adott feladaton elért pontosság osztva az eléréséhez felhasznált energiával. Feltételezve, hogy a helyi és a felhőrendszerek hasonló pontosságot érnek el, a magasabb intelligencia per watt értékkel rendelkező rendszer a hatékonyabb választás.
Miért fontos?

A kutatók gyorsan fejlesztik a nagy nyelvi modelleket, így azonos energiafelhasználás mellett egyre nagyobb teljesítményt érnek el. Ennek a fejlődésnek a követése felfedi az energia és a teljesítmény közötti kompromisszumot. Ahogy ez az egyensúly egyre inkább az alacsony fogyasztású eszközök felé billen, a felhasználóknak több lehetőségük lesz a számítási terhelés megosztására és a gépi intelligencia szélesebb körű elterjesztésére. ---

Eredeti forrás megtekintése (angol) →