Az Inflection AI startup közzétette az Inflection-1 modell teljesítményének részleteit

AI MODELLEK

Az Inflection AI startup közzétette az Inflection-1 modell teljesítményének részleteit

2023. június 26. · MI Történik? · 1 perc olvasás

Az Inflection AI startup közzétett néhány részletet az Inflection-1 nevű nyelvi modelljéről. Az Inflection egy viszonylag ismeretlen startup, amelynek vezérigazgatója, Mustafa Suleyman, korábban a DeepMind társalapítója volt. A vállalat eddig egyetlen, felhasználók számára elérhető szolgáltatást indított el, amellyel a heypi.com oldalon lehet kísérletezni. Az Inflection-1-et „több ezer NVIDIA H100 GPU segítségével, egy rendkívül nagy adatkészleten tanították” – az NVIDIA új H100-as chipjei iránt hatalmas a kereslet, ami arra utal, hogy az Inflectionnek sikerült korai vagy kedvezményes hozzáférést kialkudnia hozzájuk. A GPT-3.5, LLaMA, Chinchilla és PaLM 540B modellekkel végzett tesztek során az Inflection-1 jól teljesített a TriviaQA-tól az MMLU-ig terjedő benchmarkokon, bár elmarad a nagyobb modellektől, mint például a GPT-4 és a PaLM 2-L.

Több ezer NVIDIA H100 GPU-val tanították egy hatalmas adatkészleten.
A TriviaQA és MMLU teszteken felülmúlja a GPT-3.5, LLaMA, Chinchilla és PaLM 540B modelleket, vagy versenyre kel velük.
Teljesítménye még elmarad az olyan csúcskategóriás modellektől, mint a GPT-4 és a PaLM 2-L.
Ez a modell működteti a nyilvánosan elérhető „Hey Pi” társalgási szolgáltatást.

Miért fontos?

Néhány évvel ezelőtt még csak maroknyi szervezet épített nagyméretű nyelvi modelleket (főleg az OpenAI és a DeepMind). Manapság viszont már alapvetésnek számít, hogy minden komoly tőkével rendelkező vállalatnak szüksége van egy saját nagy nyelvi modellre. Ez azt sugallja, hogy bár drágák, a nyelvi modellek tömegtermékké (commodity) válnak, és a köztük lévő különbséget a viselkedésükkel kapcsolatos stilisztikai döntések legalább annyira meghatározzák majd, mint a beléjük fektetett nyers erőforrások. ---

Eredeti forrás megtekintése (angol) →