A Google DeepMind AlphaProof és AlphaGeometry 2 rendszere ezüstérmet szerzett a matematika olimpián
Miközben a világ ezen a hétvégén a párizsi olimpiára figyelt, egy másik éremosztó verseny csendben történelmet írt. A Google DeepMind két új AI rendszere, az AlphaProof és az AlphaGeometry 2 ezüstérmes teljesítményt nyújtott a Nemzetközi Matematikai Diákolimpián (IMO). A kontextus fontos: míg az emberi versenyzőknek körülbelül 9 órájuk volt, az AI az egyik feladatot kevesebb mint 19 másodperc alatt oldotta meg – a többivel viszont akár 3 napig is küzdött. A DeepMind AI-ja immár az elmúlt 25 év korábbi IMO geometria feladatainak 83%-át képes megoldani, szemben az előző verzió 53%-ával. Az egyik bíró (aki maga is érmes volt) annyira le volt nyűgözve a rendszer megoldásától, hogy „mágikus kulcsnak” nevezte. A DeepMind tervei szerint „nagyon hamar” átülteti az AlphaProof/Geometry 2 matematikai tudását a Gemini modelljeibe. Ez olyan AI chatbotokat jelent, amelyek kifejezetten jók matematikából – egy olyan területen, amellyel korábban küzdöttek (végül is „nyelvi” modellnek hívják őket...).
- Az IMO egyetemi tanulmányok előtt álló matematikusokat állít kihívás elé hat rendkívül nehéz feladattal, két 4,5 órás fordulóban.
- A DeepMind AI-ja a 6-ból 4 feladatot hibátlanul megoldott, 42-ből 28 pontot szerezve – mindössze egy ponttal maradva el az aranyéremtől.
- Figyelemre méltó, hogy az AI megoldotta a legnehezebb feladatot is, amelyet csak öt emberi versenyzőnek sikerült megfejtenie.
- A hírek hatására az arra vonatkozó előrejelzések, hogy egy AI aranyat nyer a 2025-ös IMO-n, 25%-ról 70%-ra ugrottak.
Miért fontos?
18 hónappal ezelőtt a szakértők még úgy gondolták, hogy az AI ilyen szintű matematikai készségeitől 5-7 évre vagyunk. Sok ilyen feladat kreativitást, érvelést és problémamegoldást igényel – olyan képességeket, amelyeket egykor egyedülállóan emberinek tartottak. Néhány AI kutató a 2025-ös IMO-n elért esetleges aranyérmet annak bizonyítékaként látja, hogy a szupererős AI hamarabb érkezik, mint gondoltuk. Ha ez megtörténik, az azt jelentheti, hogy a transzformatív AI fő akadálya nem az új, alapvető algoritmikus áttörések hiánya, hanem a régi jó mérnöki munka.