MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

A Google DeepMind megerősítéses tanuláson alapuló öntanítással növeli a modellteljesítményt

A Google DeepMind bemutatta a ReST^EM (Expectation-Maximization for Reinforced Self-Training) technikát, amely megerősítéses tanulást (reinforcement learning) használ magasabb minőségű adatkészletek iteratív generálásához. Ez az AI „bootstrapping” egy formája, ahol egy AI-t használnak az utódrendszerei tanításához szükséges alapanyagok előállításához. A technika a korábbi Reinforce Self-Training (ReST) munkára épül, és célja az ember által generált adatoktól való függőség csökkentése az olyan összetett feladatoknál, mint a matematika és a programozás.
Miért fontos?

A ReST^EM az AI bootstrapping életképességének jele. Ha ez a trend folytatódik, felgyorsítja az intelligensebb rendszerek fejlesztését, csökkenti az adatkészletek relatív költségét, és növeli az alapmodellekbe fektetett hatalmas számítási kapacitás (compute) értékét. ---

Eredeti forrás megtekintése (angol) →