MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

A Sakana AI evolúciós technikákkal ötvözi a modelleket a teljesítmény növelése érdekében

A Sakana AI kutatói az „Evolutionary Model Merge” (Evolúciós Modell-összeolvasztás) nevű technikával kísérleteztek, amely lehetővé teszi a már meglévő AI rendszerek összeillesztését. Ez azért jelentős, mert a modellek tanítására (vagy akár finomhangolására) fordított költségek nélkül képesek egyfajta „1+1 = 3” műveletet végrehajtani: meglévő modellekből új, az alkotóelemek összességénél nagyobb teljesítményű rendszereket hoznak létre. Amit elértek: Az Evolutionary Model Merge módszerük „evolúciós technikákat alkalmaz, hogy hatékonyan megtalálja a legjobb módokat a különböző nyílt forráskódú (open-source), eltérő képességű modellek kombinálására”. Ezt két fő módon teszik: a modellek adatfolyam-terében (data flow space) és a paraméter-térben (parameter space) történő összeolvasztással. Az eredmények lenyűgözőek: Megközelítésüket két modell – egy matematikára optimalizált japán LLM és egy japán vizuális nyelvi modell – tanításával tesztelték. „Az evolúció útján létrejött 7 milliárd paraméteres japán matematikai LLM-ünk meglepetésünkre a legmagasabb pontszámot érte el számos más japán LLM benchmarkon, sőt, még néhány korábbi, 70 milliárd paraméteres SOTA japán LLM teljesítményét is túlszárnyalta!” – írták.
Miért fontos?

Ha az evolúciós modell-összeolvasztás nagy léptékben is működik, a nyíltan hozzáférhető modellek tetszőlegesen kombinálhatóvá válnak meglepően erős képességek eléréséhez, megkérdőjelezve a költséges, számításigényes modellfejlesztés jelenlegi paradigmáját. ---

Eredeti forrás megtekintése (angol) →