Az OpenAI és a Google érvelő modelljei felülmúlták a világ legjobb programozóit az ICPC-n
A világ legjobb egyetemi programozóit éppen az AI oktatta le. Az OpenAI érvelő modelljei tökéletes, 12/12-es pontszámot értek el az ICPC világdöntőjén, a világ legrangosabb programozási versenyén… és ezzel minden emberi csapatot felülmúltak. Viszonyításképpen: a legjobb emberi csapat 12-ből 11 feladatot oldott meg. Az OpenAI ugyanazon 5 órás időkeret alatt versenyzett, mint az emberek. Általános célú modellek együttesét használták, köztük a GPT-5-öt, speciális versenyprogramozói tréning nélkül. Sőt, 12 feladatból 11-et már az első próbálkozásra megoldottak. Ez kicsit olyan, mintha azt néznénk, ahogy a Deep Blue tönkrever egy sakknagymestert, csak ezúttal a kódoló zsenik egy egész generációjával történik meg. Az OpenAI természetesen nem volt egyedül a csúcson. A Google Gemini 2.5 Deep Think modellje szintén aranyat nyert, 12-ből 10 feladatot megoldva. Ez azt jelenti, hogy két különböző AI rendszer is jobban teljesített a bolygó összes emberi csapatánál. A Gemini 8 feladatot mindössze 45 perc alatt oldott meg, és megbirkózott egy olyan feladattal is, amely minden emberi csapaton kifogott. A „C” feladat folyadékáramlás optimalizálását érintette összekapcsolt csatornákon keresztül (meg sem próbáljuk elmagyarázni; nehéz!). De a „C” feladat nem volt akadály a Gemini számára; okos felismeréseket használt a prioritási értékekről és a minimax elméletről, amire egyetlen emberi versenyző sem tudott rájönni. Ez megkoronázza az OpenAI lenyűgöző sorozatát az akadémiai versenyeken. Ugyanezek az érvelő rendszerek nemrégiben domináltak a Nemzetközi Matematikai Diákolimpián és a Nemzetközi Informatikai Diákolimpián is, bizonyítva, hogy nem csak egyetlen területen erősek. Érdemes megjegyezni: mindkét programozási eredmény (ICPC és IOI) ensemble (együttes) megközelítést és némi strukturális támogatást használt, nem egyetlen modell önálló teljesítményét.
- Az ICPC brutális. Ez az algoritmikus programozás olimpiája, ahol háromfős hallgatói csapatok oldanak meg összetett feladatokat intenzív időnyomás alatt.
- Az OpenAI általános érvelő modelleket használt, nem kifejezetten programozási versenyekre képzetteket.
- A győztes emberi csapat (SPbSU) az utolsó feladatát mindössze 2 perccel a verseny vége előtt oldotta meg.
- A Gemini 8 feladatot 45 perc alatt tudott le, és megoldott egy olyan problémát, amelyen minden emberi csapat elbukott.
- A Google modellje okos meglátásokat alkalmazott a prioritási értékekről és a minimax elméletről a „C” feladat megoldásához, amit egyetlen emberi versenyző sem tudott megfejteni.
Miért fontos?
Ez az első mérhető bizonyíték arra, hogy az AI emberfeletti képességeket ért el a programozásban. Évekig az AI „majdnem olyan jó” volt, mint a legjobb emberek a programozási versenyeken. Most már egyértelműen jobb. A következmények megdöbbentőek. Ha az AI képes elsajátítani a legnehezebb, briliáns elmék megakasztására tervezett algoritmikus feladatokat, mi következik ezután? Az OpenAI az „új ismeretek felfedezését” és a „tudományos felfedezések automatizálását” nevezte meg a következő határterületként.