SAKANA AI
A GPT-5 lett az első AI modell, amely képes megfejteni egy teljes 9x9-es Sudoku-t
A GPT-5 lett az első AI modell, amely megoldott egy teljes 9x9-es Sudoku rejtvényt a Sakana AI Sudoku-Bench mérése szerint, amely a mély érvelést, a térbeli logikát és a kreativitást teszteli.
- A májusban indított Sudoku-Bench klasszikus és modern Sudoku variációkkal teszteli az LLM-eket, amelyek több szabályrendszert ötvöznek és hosszú, többlépcsős érvelést igényelnek.
- Korábban egyetlen modellnek sem sikerült teljes 9x9-es rejtvényt megoldania, amíg a GPT-5 fel nem törte azt, elődeinél jobb térbeli és logikai érvelést mutatva.
- A GPT-5 emellett 33%-os megoldási arányt ért el a rejtvényeknél — ez nagyjából a duplája a korábbi vezetőnek, ami jelentős előrelépést jelent a benchmark teljesítményben.
- A rejtvények 67%-a továbbra is megoldatlan marad, mivel a modellek küzdenek a meta-érveléssel (új szabályok tanulása) és a kreatív „behatolással”, amelyet az emberek természetes módon alkalmaznak.
Miért fontos?
A GPT-5 Sudoku-áttörése valódi fejlődést mutat a strukturált érvelésben, de azt is jelzi, milyen messze van még az AI az emberi gondolkodástól. Ezen szakadék áthidalásához olyan modellekre lesz szükség, amelyek ötvözik a matematikai logikát, a térbeli tudatosságot és a kreatív meglátást — lényegében ugyanazt a készségkombinációt, amelyet mi használunk az ismeretlen megértéséhez. ---