Az AI2 elindította az OLMo-t, a teljesen nyílt forráskódú, csúcskategóriás nyelvi modellt

2024. február 8. · MI Történik? · 1 perc olvasás

Az Allen Institute for AI (AI2) közzétette az OLMo-t (Open Language Model), egy valóban nyílt forráskódú, 7 milliárd paraméteres modellt. Sok más „nyíltnak” nevezett modellel ellentétben, amelyek csak a súlyokat teszik közzé, az AI2 a teljes tanítóadat-készletet (Dolma), a tanító kódot és a kiértékelő csomagot is elérhetővé tette. Az átláthatóságnak ez a szintje azt a célt szolgálja, hogy segítse a kutatói közösséget az LLM-tanítás mechanizmusainak megértésében, és elősegítse az AI viselkedésének és elfogultságának szigorúbb tudományos vizsgálatát.

Tartalmazza a tanításhoz használt teljes, 3 billió tokenből álló Dolma adathalmazt
A teljes reprodukálhatóság érdekében a tanító kóddal és a tanítási naplókkal együtt adták ki
Elérhető 1B és 7B paraméteres méretben, nagyobb verziók tervben vannak
Apache 2.0 licenc alatt terjesztik a korlátozások nélküli kereskedelmi és kutatási felhasználáshoz

Miért fontos?

Az adatok és a „recept” közzétételével a modell mellett az AI2 új iparági sztenderdet állít fel az átláthatóság terén, ami lehetővé teszi a kutatók számára az AI hatékonyabb auditálását és fejlesztését.

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

Epicure: Egy többnyelvű AI összetevő-beágyazó modell receptanalízishez

2026. május 28.

Claude Mythos: Az Anthropic állítólag rendkívül erős, még meg nem jelent AI modellje

2026. április 15.

Az Anthropic egy védetlen adatbázison keresztül szivárogtatta ki a nagy teljesítményű Claude Mythos modellt

2026. március 30.

Tudj meg többet

Nagy nyelvi modellek (LLM): Hogyan működnek a ChatGPT-féle rendszerek?