AI MODELLEK
Az AI2 elindította az OLMo-t, a teljesen nyílt forráskódú, csúcskategóriás nyelvi modellt
Az Allen Institute for AI (AI2) közzétette az OLMo-t (Open Language Model), egy valóban nyílt forráskódú, 7 milliárd paraméteres modellt. Sok más „nyíltnak” nevezett modellel ellentétben, amelyek csak a súlyokat teszik közzé, az AI2 a teljes tanítóadat-készletet (Dolma), a tanító kódot és a kiértékelő csomagot is elérhetővé tette. Az átláthatóságnak ez a szintje azt a célt szolgálja, hogy segítse a kutatói közösséget az LLM-tanítás mechanizmusainak megértésében, és elősegítse az AI viselkedésének és elfogultságának szigorúbb tudományos vizsgálatát.
- Tartalmazza a tanításhoz használt teljes, 3 billió tokenből álló Dolma adathalmazt
- A teljes reprodukálhatóság érdekében a tanító kóddal és a tanítási naplókkal együtt adták ki
- Elérhető 1B és 7B paraméteres méretben, nagyobb verziók tervben vannak
- Apache 2.0 licenc alatt terjesztik a korlátozások nélküli kereskedelmi és kutatási felhasználáshoz
Miért fontos?
Az adatok és a „recept” közzétételével a modell mellett az AI2 új iparági sztenderdet állít fel az átláthatóság terén, ami lehetővé teszi a kutatók számára az AI hatékonyabb auditálását és fejlesztését.