MA AZ AI VILÁGÁBAN
A megerősítéses tanulás úttörői kapták a rangos Turing-díjat
Az 1980-as években, amikor Andrew Barto és Rich Sutton számítástechnikusok kísérletezni kezdtek azzal az ötlettel, hogy a gépek az állatokhoz hasonlóan, próbálkozások és hibák útján is képesek tanulni, sok ellenállásba ütköztek. Évtizedekkel később az elméletük a modern LLM-ek középpontjába került. Most elnyerték az idei Turing-díjat, a szakterület legmagasabb kitüntetését.
- Barto és Sutton a megerősítéses tanulás (reinforcement learning) terén végzett alapvető munkájukért kapták az elismerést.
- A páros évtizedekig tartó szkepticizmussal nézett szembe, mielőtt módszereik a modern AI oktatás alapjává váltak volna.
- A kutatók véleménye megoszlik a jövőt illetően: Barto „géprombolónak” vallja magát, míg Sutton szerint az AGI elkerülhetetlen.
Miért fontos?
A díj történelmi mérföldkő, amely elismeri, hogy a Barto és Sutton által úttörőként bevezetett próbálkozás-hiba módszertan a jelenlegi AI bumm elsődleges motorja. ---