A Google DeepMind AlphaProof és AlphaGeometry 2 rendszere ezüstérmet szerzett a matematika olimpián

2024. július 29. · MI Történik? · 1 perc olvasás

Miközben a világ ezen a hétvégén a párizsi olimpiára figyelt, egy másik éremosztó verseny csendben történelmet írt. A Google DeepMind két új AI rendszere, az AlphaProof és az AlphaGeometry 2 ezüstérmes teljesítményt nyújtott a Nemzetközi Matematikai Diákolimpián (IMO). A kontextus fontos: míg az emberi versenyzőknek körülbelül 9 órájuk volt, az AI az egyik feladatot kevesebb mint 19 másodperc alatt oldotta meg – a többivel viszont akár 3 napig is küzdött. A DeepMind AI-ja immár az elmúlt 25 év korábbi IMO geometria feladatainak 83%-át képes megoldani, szemben az előző verzió 53%-ával. Az egyik bíró (aki maga is érmes volt) annyira le volt nyűgözve a rendszer megoldásától, hogy „mágikus kulcsnak” nevezte. A DeepMind tervei szerint „nagyon hamar” átülteti az AlphaProof/Geometry 2 matematikai tudását a Gemini modelljeibe. Ez olyan AI chatbotokat jelent, amelyek kifejezetten jók matematikából – egy olyan területen, amellyel korábban küzdöttek (végül is „nyelvi” modellnek hívják őket...).

Az IMO egyetemi tanulmányok előtt álló matematikusokat állít kihívás elé hat rendkívül nehéz feladattal, két 4,5 órás fordulóban.
A DeepMind AI-ja a 6-ból 4 feladatot hibátlanul megoldott, 42-ből 28 pontot szerezve – mindössze egy ponttal maradva el az aranyéremtől.
Figyelemre méltó, hogy az AI megoldotta a legnehezebb feladatot is, amelyet csak öt emberi versenyzőnek sikerült megfejtenie.
A hírek hatására az arra vonatkozó előrejelzések, hogy egy AI aranyat nyer a 2025-ös IMO-n, 25%-ról 70%-ra ugrottak.

Miért fontos?

18 hónappal ezelőtt a szakértők még úgy gondolták, hogy az AI ilyen szintű matematikai készségeitől 5-7 évre vagyunk. Sok ilyen feladat kreativitást, érvelést és problémamegoldást igényel – olyan képességeket, amelyeket egykor egyedülállóan emberinek tartottak. Néhány AI kutató a 2025-ös IMO-n elért esetleges aranyérmet annak bizonyítékaként látja, hogy a szupererős AI hamarabb érkezik, mint gondoltuk. Ha ez megtörténik, az azt jelentheti, hogy a transzformatív AI fő akadálya nem az új, alapvető algoritmikus áttörések hiánya, hanem a régi jó mérnöki munka.

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

A Unitree humanoid robotja meghódított egy 20 000 láb magas vulkánt Ecuadorban

1 órája

Az OpenAI drasztikus API árcsökkentést fontolgat és az Ona infrastruktúra-startup felvásárlását tervezi

3 órája

Az Anthropic kutatója négy kulcsfontosságú promptstratégiát vázolt fel a Claude Fable 5-höz

12 órája

Tudj meg többet

Perplexity AI: A Google-kereső AI-vel felturbózva

Nagy nyelvi modellek (LLM): Hogyan működnek a ChatGPT-féle rendszerek?