MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

A Google Research szerint az AI-visszajelzés megegyezik az emberi teljesítménnyel az RLHF-ben

A Google kutatói tanulmányt tettek közzé az AI-visszajelzésen alapuló megerősítéses tanulásról (RLAIF), amely kimutatta, hogy az azonos szinten teljesít, mint az emberi visszajelzésen alapuló megerősítéses tanulás (RLHF). Ez a felfedezés az AI-fejlesztés egyik legfőbb szűk keresztmetszetét orvosolja: az emberi címkézés magas költségét és lassúságát. A DeepMind is hozzájárult ehhez a területhez a Reinforced Self-Training (ReST) munkájával.

Miért fontos?

Ha az AI képes hatékonyan tanítani és finomhangolni saját magát minimális emberi beavatkozással, a modellek fejlődési sebessége valószínűleg exponenciálisan felgyorsul, miközben a költségek csökkennek. ---

Eredeti forrás megtekintése (angol) →
Kapcsolódó hírek
A Perplexity és a Harvard tanulmánya feltérképezi az összetett AI ágens alapú munka felé való eltolódást
3 napja
Az MIT tanulmánya azonosítja a legfőbb AI-kockázatokat és a felelős intézményeket
4 napja
Tanulmány: Az AI tutorok felülmúlják a jogi kart
2026. június 4.
Tudj meg többet
AI a kutatásban és oktatásban: Hatékony irodalomkutatás és forráselemzés
Perplexity AI: A Google-kereső AI-vel felturbózva