A Google AI-ja kilenc megoldatlan matematikai problémát oldott meg
A matematikai kutatások világában mérföldkőnek számító áttörést ért el a Google DeepMind, miután AlphaProof Nexus nevű rendszere kilenc, korábban megoldatlan Erdős-problémát sikerrel igazolt. A technológiai bravúr különösen figyelemre méltó, mivel a megoldott feladatok közül kettő már 56 éve dacolt a tudományos közösséggel. Az eredmények alig egy nappal azután láttak napvilágot, hogy az OpenAI bejelentette saját hasonló sikereit az Erdős-sejtések körében, ami jól mutatja az AI-fejlesztők közötti élesedő versenyt az absztrakt matematikai problémák megoldásában.
A siker kulcsa az AlphaProof Nexus innovatív felépítésében rejlik, amely egy kifinomult LLM-et kapcsolt össze a Lean bizonyítássegítő szoftverrel. Ez a kombináció lehetővé teszi, hogy az AI ne csupán találgasson, hanem szigorúan gépi ellenőrzésű, logikailag hibátlan bizonyításokat generáljon a kombinatorika és a gráfelmélet komplex területén. A rendszer működési elve egy iteratív folyamaton alapul: az AI elméleteket generál, amelyeket a Lean azonnal tesztel, és a folyamat addig ismétlődik, amíg a bizonyítás át nem megy a szigorú matematikai ellenőrzésen. A projekt hatékonyságát jelzi, hogy minden egyes probléma megoldása csupán néhány száz dollárnyi számítási költséget emésztett fel, emellett a rendszer sikerrel birkózott meg az Online Encyclopedia of Integer Sequences 44 nyitott sejtésével is.
Ez a fejlődés alapjaiban változtathatja meg a matematikai kutatások jövőjét, mivel az AI képessé válik az emberi sebességet messze meghaladó ütemben új felfedezéseket tenni. Bár a rendszer egy egyszerűbb verziója hasonló teljesítményt nyújtott, de lényegesen magasabb költségek mellett, a technológia korlátai is kirajzolódnak: az olyan problémák, amelyek teljesen új, eredeti matematikai konstrukciók megalkotását igénylik, egyelőre megoldhatatlannak bizonyultak. Ezzel párhuzamosan az OpenAI is jelentős sikereket könyvelhetett el, miután AI-juk megcáfolt egy 80 éves Erdős-sejtést, hónapokkal azután, hogy korábbi, 10 problémát érintő bejelentésüket visszavonták. A Google DeepMind sikere azonban rámutat arra, hogy a formális verifikáció és a nagy nyelvi modellek ötvözése milyen gyorsan teszi lehetővé az évtizedek óta fennálló akadályok ledöntését, a kutatók számára pedig egy olyan eszközt biztosít, amely a jövőben gépi sebességgel segítheti a tudomány előrehaladását.
- A rendszer egy LLM-et kapcsolt össze a Lean bizonyítássegítővel, hogy gépi ellenőrzésű bizonyításokat generáljon a kombinatorika és a gráfelmélet területéhez tartozó kilenc probléma megoldására.
- Minden egyes probléma megoldása néhány száz dollárba került, és az AI emellett az Online Encyclopedia of Integer Sequences (Egész számok sorozatainak online enciklopédiája) 44 nyitott sejtését is bebizonyította.
- Az ügynök egy egyszerűbb verziója hasonló eredményeket ért el, de magasabb költséggel, az új matematikai konstrukciókat igénylő problémák pedig továbbra is megoldhatatlanok maradtak.
- Az OpenAI múlt heti sikere során az AI-juk megcáfolt egy 80 éves Erdős-sejtést – hónapokkal azután, hogy visszavonták azt az állításukat, miszerint 10 új problémát oldottak meg.
A Google évtizedek óta megoldatlan matematikai problémák terén elért eredményei mutatják, milyen gyorsan halad az AI az eredeti megoldások felé, és hogy a formális verifikáció hogyan változtatja meg a szabályokat. A rendszer generálja a bizonyításokat, ellenőrzi azokat a Leanben, és addig ismétli a folyamatot, amíg az egyik át nem megy. Idővel ez segíteni fog a kutatóknak, hogy gépi sebességgel érjenek el újszerű felfedezéseket. ---