MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az Allen Institute for AI közzéteszi a nyílt OLMo nyelvi modellcsaládot

Az Allen Institute for AI létrehozta az OLMo-t, egy „valóban nyílt” nyelvi modellcsaládot, amelynek célja a tanítási folyamat demisztifikálása. Sok „nyílt” modellel ellentétben, amelyek csak a súlyokat teszik közzé, az OLMo a teljes keretrendszert biztosítja: adatokat, tanítási naplókat, értékelő eszközöket és több száz modell-ellenőrzőpontot (checkpoint). A kezdeti kiadás legfeljebb 7B méretű modelleket tartalmaz, egy 65B-s modell pedig jelenleg áll tanítás alatt. A projekt több számítási alapot is megvizsgált, beleértve az európai LUMI szuperszámítógépet.
Miért fontos?

Az OLMo modellek teljesítménye nem annyira fontos a tanításuk során alkalmazott nyitottsághoz képest. Azzal, hogy nyilvánosan közzéteszik a tanultakat, a kutatók segítik a szélesebb kutatói közösséget a nyelvi modellek jobb tanulmányozásában.

Eredeti forrás megtekintése (angol) →