MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az open-source modellek bezárják a teljesítménybeli szakadékot a zárt rendszerekkel szemben

Az mesterséges intelligencia világában hosszú ideig egyértelmű volt a felállás: a legfejlettebb képességeket kizárólag a zárt forráskódú, fizetős modellek kínálták, míg a nyílt alternatívák jelentős lemaradásban voltak. Idén azonban alapvető fordulatot vett ez a trend, és az open-source modellek rohamos tempóban kezdték el bezárni a teljesítménybeli szakadékot. A Meta Llama-sorozata és a Mistral modelljei olyan szintű fejlődést produkáltak, amely alapjaiban kérdőjelezi meg a zárt rendszerek egyeduralmát. Míg korábban a nyílt forráskódú megoldások inkább csak a kisebb, specifikus feladatokra voltak alkalmasak, mára eljutottunk odáig, hogy a legújabb fejlesztések már a legfejlettebb kereskedelmi megoldásokkal is felveszik a versenyt a legfontosabb teljesítménymutatók tekintetében.

A fejlődés egyik legfontosabb mérföldköve a Meta által kiadott Llama 3.1 volt, amely fordulópontot jelentett az iparág számára. Ez a modell bizonyította be először, hogy egy nyílt forráskódú architektúra is képes rivalizálni az OpenAI által fejlesztett GPT-4 teljesítményével. Bár bizonyos rétegfeladatokban vagy komplex logikai műveletekben a zárt modellek még mindig megőriztek némi előnyt, a Llama 3.1 megjelenése óta az AI közösség és a fejlesztők végre valódi, nagy teljesítményű alternatívát kaptak. Ez a váltás azért kiemelten fontos, mert a vállalatok és kutatók számára lehetővé teszi a modellek mélyebb testreszabását és saját infrastruktúrán történő futtatását anélkül, hogy függniük kellene egy külső szolgáltató API-jaitól vagy szigorú adatvédelmi feltételeitől.

A jövőbeli kilátások még biztatóbbak a nyílt forráskódú mozgalom számára, hiszen a Meta már gőzerővel dolgozik a következő generáción. A vállalat várakozásai szerint a készülő Llama 4 tanítása várhatóan tízszer több számítási kapacitást igényel majd, mint amit a Llama 3 fejlesztésekor felhasználtak. Ez a hatalmas GPU-erőforrás-igény is jól mutatja, hogy a nyílt forráskódú modellek mögött álló technológiai óriások nem lassítanak a skálázásban. A szakadék várhatóan még tovább fog szűkülni az elkövetkező hónapokban, ahogy ezek a masszív számítási erővel támogatott rendszerek elérhetővé válnak a publikum számára. A Llama 4 érkezésétől sokan már nemcsak a felzárkózást, hanem bizonyos területeken a vezető szerep átvételét is várják a zárt rendszerektől.

Az open-source modellek felemelkedése tehát nem csupán technológiai érdekesség, hanem komoly piaci átrendeződést is jelent. Az, hogy az AI fejlesztés legmagasabb szintje többé nem korlátozódik néhány zárt rendszerre, demokratizálja a hozzáférést a csúcstechnológiához. A Mistral és a Meta sikerei bizonyítják, hogy az átláthatóbb és hozzáférhetőbb fejlesztési modellek is képesek világszínvonalú eredményeket produkálni. Ezzel a változással a fejlesztők és a startupok végre szabadon dönthetnek arról, hogy melyik irányt választják, anélkül, hogy kompromisszumot kellene kötniük a teljesítmény rovására. Ez a versenyhelyzet pedig végső soron felgyorsíthatja az innovációt az egész AI ökoszisztémában, hiszen a zárt modellek fejlesztőit is folyamatos megújulásra kényszeríti.

Miért fontos?

Az open-source végre felzárkózott a zárt modellekhez, erőteljes és hozzáférhető alternatívákat kínálva. ---

Eredeti forrás megtekintése (angol) →
Kapcsolódó hírek
Elon Musk xAI-ja gyorsan jelentős AI-hatalommá válik
6 napja
Az AI videó- és audiótechnológia eléri a fősodorbeli használhatóságot 2024-ben
6 napja
Az AI dominálja a professzionális munkafolyamatokat a kódolásban és a digitális marketingben
6 napja
Tudj meg többet
Nagy nyelvi modellek (LLM): Hogyan működnek a ChatGPT-féle rendszerek?