MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az Inflection AI startup közzétette az Inflection-1 modell teljesítményének részleteit

Az Inflection AI startup közzétett néhány részletet az Inflection-1 nevű nyelvi modelljéről. Az Inflection egy viszonylag ismeretlen startup, amelynek vezérigazgatója, Mustafa Suleyman, korábban a DeepMind társalapítója volt. A vállalat eddig egyetlen, felhasználók számára elérhető szolgáltatást indított el, amellyel a heypi.com oldalon lehet kísérletezni. Az Inflection-1-et „több ezer NVIDIA H100 GPU segítségével, egy rendkívül nagy adatkészleten tanították” – az NVIDIA új H100-as chipjei iránt hatalmas a kereslet, ami arra utal, hogy az Inflectionnek sikerült korai vagy kedvezményes hozzáférést kialkudnia hozzájuk. A GPT-3.5, LLaMA, Chinchilla és PaLM 540B modellekkel végzett tesztek során az Inflection-1 jól teljesített a TriviaQA-tól az MMLU-ig terjedő benchmarkokon, bár elmarad a nagyobb modellektől, mint például a GPT-4 és a PaLM 2-L.
Miért fontos?

Néhány évvel ezelőtt még csak maroknyi szervezet épített nagyméretű nyelvi modelleket (főleg az OpenAI és a DeepMind). Manapság viszont már alapvetésnek számít, hogy minden komoly tőkével rendelkező vállalatnak szüksége van egy saját nagy nyelvi modellre. Ez azt sugallja, hogy bár drágák, a nyelvi modellek tömegtermékké (commodity) válnak, és a köztük lévő különbséget a viselkedésükkel kapcsolatos stilisztikai döntések legalább annyira meghatározzák majd, mint a beléjük fektetett nyers erőforrások. ---

Eredeti forrás megtekintése (angol) →