MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

A Google DeepMind megerősítéses tanuláson alapuló öntanítással növeli a modellteljesítményt

A Google DeepMind bemutatta a ReST^EM (Expectation-Maximization for Reinforced Self-Training) technikát, amely megerősítéses tanulást (reinforcement learning) használ magasabb minőségű adatkészletek iteratív generálásához. Ez az AI „bootstrapping” egy formája, ahol egy AI-t használnak az utódrendszerei tanításához szükséges alapanyagok előállításához. A technika a korábbi Reinforce Self-Training (ReST) munkára épül, és célja az ember által generált adatoktól való függőség csökkentése az olyan összetett feladatoknál, mint a matematika és a programozás.

Miért fontos?

A ReST^EM az AI bootstrapping életképességének jele. Ha ez a trend folytatódik, felgyorsítja az intelligensebb rendszerek fejlesztését, csökkenti az adatkészletek relatív költségét, és növeli az alapmodellekbe fektetett hatalmas számítási kapacitás (compute) értékét. ---

Eredeti forrás megtekintése (angol) →
Kapcsolódó hírek
Az 5-szintes AI jártassági modell teljesen kezdőknek
2026. április 2.
Hogyan használjuk a Dispatch-et a számítógép távoli vezérlésére a Claude segítségével
2026. március 25.
Hogyan használd a Claude-ot AI tárhelytisztító segédpilótaként
2026. március 24.
Tudj meg többet
Perplexity AI: A Google-kereső AI-vel felturbózva
Gemini a Gmail-ben és a Google Docs-ban: Így automatizáld a munkád