A megerősítéses tanulás úttörői kapták a rangos Turing-díjat

2025. március 6. · MI Történik? · 1 perc olvasás

Az 1980-as években, amikor Andrew Barto és Rich Sutton számítástechnikusok kísérletezni kezdtek azzal az ötlettel, hogy a gépek az állatokhoz hasonlóan, próbálkozások és hibák útján is képesek tanulni, sok ellenállásba ütköztek. Évtizedekkel később az elméletük a modern LLM-ek középpontjába került. Most elnyerték az idei Turing-díjat, a szakterület legmagasabb kitüntetését.

Barto és Sutton a megerősítéses tanulás (reinforcement learning) terén végzett alapvető munkájukért kapták az elismerést.
A páros évtizedekig tartó szkepticizmussal nézett szembe, mielőtt módszereik a modern AI oktatás alapjává váltak volna.
A kutatók véleménye megoszlik a jövőt illetően: Barto „géprombolónak” vallja magát, míg Sutton szerint az AGI elkerülhetetlen.

Miért fontos?

A díj történelmi mérföldkő, amely elismeri, hogy a Barto és Sutton által úttörőként bevezetett próbálkozás-hiba módszertan a jelenlegi AI bumm elsődleges motorja. ---

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

Az Anthropic elindította az Ode-ot, egy önálló vállalati AI-szolgáltató céget

11 órája

A Weco AI kísérleti bizonyítékot közölt az autonóm rekurzív önfejlesztésre

tegnap

Az SK Hynix 26,5 milliárd dollárt gyűjtött rekordot döntő amerikai tőzsdei bevezetésével

2 napja

Tudj meg többet

AI az oktatásban: Személyre szabott tanulási utak diákoknak és tanároknak

Gépi tanulás: mi az és hogyan működik? Érthető magyarázat kezdőknek