A Meta kiadta a következő generációs Llama 3-at, hogy felvegye a versenyt a GPT-4-gyel
A Meta hivatalosan is bemutatta a következő generációs, open-source nagy nyelvi modelljét, a Llama 3-at, amellyel közvetlen kihívást intéz a piacon domináló GPT-4 ellen. Az újonnan debütáló 8 milliárd (8B) és 70 milliárd (70B) paraméteres verziók a vállalat saját mérései szerint rendkívül impresszív eredményeket értek el. Az értékelések alapján ezek a modellek számos kulcsfontosságú teszten határozottan felülmúlják a jelenlegi nyílt forrású versenytársakat, ezzel pedig egy teljesen új fejezetet nyitnak a mesterséges intelligencia fejlesztésének globális versenyében.
A technikai részleteket vizsgálva kiderül, hogy a Llama 3 fejlesztése mögött elképesztő adatmennyiség és komoly mérnöki munka áll. A Meta tesztjei alapján a 8B and 70B variánsok képesek maguk mögé utasítani az olyan hasonló kategóriájú, piacon lévő modelleket, mint a Google Gemma, a Mistral 7B, vagy éppen az Anthropic Claude 3 Sonnet. Ez a látványos ugrás egyáltalán nem véletlen, hiszen az újdonságokat egy gigantikus, 15 billió (15T) tokent tartalmazó adathalmazon tanították. Ez a mennyiség hétszer nagyobb, mint amit a korábbi Llama 2 esetében használtak, ráadásul négyszer több kódot is tartalmazott. Ha ez még nem lenne elég, a vállalat már gőzerővel készíti elő a legnagyobb, 400 milliárd (400B) paraméteres verziót is, amelynek megjelenése a következő hónapokban várható, és amely a tervek szerint versenyképes lesz a GPT-4-gyel.
A technológiai áttörés igazi jelentősége azonban nemcsak a nyers számokban és a benchmark eredményekben rejlik, hanem a globális disztribúcióban, amellyel Zuckerberg mesterterve végre kezd alakot ölteni. Miközben az átlagember mindennapi érintkezése az AI technológiákkal jelenleg még meglehetősen korlátozott, a Meta egyetlen lépéssel teljesen megváltoztatja a játékszabályokat. Az új Llama 3 modellt ugyanis a Meta AI asszisztensen keresztül közvetlenül beépítik a mindennapokban használt platformokba. Ez azt jelenti, hogy a technológia közvetlenül elérhetővé válik a Facebook, az Instagram, a WhatsApp és a Messenger felületein, valamint az új meta.ai weboldalon is. A Meta a széles körű integrációi révén így egy csúcskategóriás AI-modellt juttat el teljesen ingyen több mint 3 milliárd emberhez a meglévő termékein keresztül, ami gyökeresen átalakíthatja a piacot.
- A Meta tesztjei szerint a Llama 3 8B és 70B felülmúlja a hasonló méretű modelleket, mint például a Google Gemma, a Mistral 7B és az Anthropic Claude 3 Sonnet modelljeit.
- A modelleket a Llama 2-nél hétszer nagyobb, 15 billió (15T) tokent és négyszer több kódot tartalmazó adathalmazon tanították.
- A legnagyobb, 400 milliárd (400B) paraméteres verzió megjelenése a következő hónapokban várható, és versenyképes lesz a GPT-4-gyel.
- A Llama 3 a Meta AI asszisztensen keresztül integrálva van a különböző platformokba, így elérhető a Facebookon, az Instagramon, a WhatsApp-on, a Messengeren és az új meta.ai weboldalon is.
A lenyűgöző teszteredményekkel és egy hamarosan érkező óriásmodellel Zuck mesterterve kezd alakot ölteni. Mivel az átlagember AI-jal való érintkezése még mindig korlátozott, a Meta széles körű integrációi révén egy csúcskategóriás AI-modellt juttatott el teljesen ingyen több mint 3 milliárd emberhez a termékein keresztül. ---