A Meta bemutatta a Llama 3.1-et: A világ legerősebb open-source modellje

A JÖVŐ AI-JA

A Meta bemutatta a Llama 3.1-et: A világ legerősebb open-source modellje

2024. július 24. · MI Történik? · 2 perc olvasás

Mennyire térhet el valójában a Llama 3.1 a 3-as verziótól? Nos, kiderült, hogy rengeteg minden rejlik a finom névváltás mögött. A Meta legújabb modellje immár 405 milliárd paraméterrel büszkélkedhet, szemben a korábbi mindössze 70 milliárddal. A frissítés váratlan erőművé tette a Llama-t, amely több kulcsfontosságú benchmark teszten is legyőzte a GPT-4o-t és a Claude 3.5-öt. Ez az első alkalom, hogy egy open-source kiadást „frontier model”-ként (úttörő modellként) lehet leírni — ami azt jelenti, hogy az AI képességek és teljesítmény élvonalába tartozik. A Llama 8b és 70b modelljei szintén hatékonyságnövelésen estek át. Miben más a Meta modellje? Az OpenAI, az Anthropic és az Alphabet mind egyetlen, mindent uraló LLM építésére törekszik. A Meta szerint nekik más elképzelésük van: arra fogadnak, hogy a vállalkozások és a magánszemélyek egyaránt olyan modellekre vágynak, amelyeket saját igényeikre szabhatnak. Ha jóslatuk beigazolódik, idővel több millió LLM keringhet majd a felhőben — mindegyik egy-egy speciális feladatra tervezve. Hogyan tervezik ezt elérni: A legnagyobb megkülönböztető tényező, hogy a Meta modellje open-source, így a fejlesztők láthatják és módosíthatják a forráskódot. Kellő mennyiségű finomhangolás után ezek az optimalizált verziók akár az eredeti alapmodellt is felülmúlhatják. A frissítés különösen izgalmas a független fejlesztők számára, akiknek nem kell várniuk a legújabb és legjobb modellre: az már most szabadon elérhető számukra. Egy másik dimenzió: A Meta egy olyan ökoszisztémát is kiépít, ahol az olyan óriáscégek, mint az Nvidia vagy az Amazon, együttműködhetnek az új projekteken kisebb startup-okkal és önfinanszírozó fejlesztőkkel. Egy merész jóslat: A legújabb teljesítménynövekedésnek (plusz néhány szórakoztató új funkciónak, például az új „Imagine Me” szelfi-eszköznek) köszönhetően Zuckerberg úgy véli, az év végére többen fogják használni a Llama-t, mint az OpenAI legújabb modelljét. Ez akár elérhető közelségbe is kerülhet, különösen mivel a ChatGPT weboldalának látogatottsága az elmúlt hónapokban visszaesett. Mivel azonban a GPT-5 már a láthatáron van, csak az idő fogja eldönteni, hogy Zuckerberg előrejelzése pontosnak bizonyul-e.

405 milliárd paraméterrel rendelkezik, ami hatalmas növekedés a korábbi 70 milliárdos verzióhoz képest.
Több kulcsfontosságú iparági benchmark teszten felülteljesíti a GPT-4o-t és a Claude 3.5-öt.
Teljesen open-source módon került kiadásra, lehetővé téve a fejlesztőknek a forráskód megtekintését, módosítását és optimalizálását.
A Llama-t „frontier model”-ként pozicionálja a teljesítmény élvonalában.
Ökoszisztémát biztosít az olyan nagyvállalatoknak, mint az Nvidia és az Amazon a kisebb fejlesztőkkel való együttműködéshez.
Új funkciókat tartalmaz a felhasználók számára, mint például az „Imagine Me” szelfi-eszköz.

Miért fontos?

A Meta arra fogad, hogy az AI jövője a testreszabható, open-source modellekben rejlik, nem pedig egyetlen zárt forráskódú LLM-ben. Ha a vállalkozások a testreszabást választják az általános célú modellekkel szemben, a Meta az év végére összesített felhasználószámban megelőzheti az OpenAI-t. ---

Eredeti forrás megtekintése (angol) →