KUTATÁS
Az OpenAI és a Google DeepMind aranyérmes szintet ért el a Matematikai Diákolimpián
Mind az OpenAI, mind a Google DeepMind modelljei aranyérmes szintet értek el a 2025-ös Nemzetközi Matematikai Diákolimpián (IMO). A verseny hat összetett feladat megoldását igényli formális bizonyításokkal, egy kilencórás időtartam alatt. Mindkét vállalat modellje sikeresen megoldott hatból öt feladatot, a lehetséges 42 pontból 35-öt elérve. Érdekesség, hogy mindkét rendszer alapvető angol nyelvű leírásokat használt a megoldásokhoz, ahelyett, hogy formális matematikai nyelvekre, például Lean-re fordította volna azokat.
Az OpenAI korán bejelentette eredményeit, figyelmen kívül hagyva a hivatalos kérést, hogy várjanak a diákok díjazásáig, míg a Google várt, így ők állíthatták, hogy megoldásaikat hivatalosan ellenőrizték.
- Mindkét vállalat 35/42 pontot ért el, csak az utolsó feladatot nem sikerült megoldaniuk.
- A modellek alapvető angol nyelvű érvelésre támaszkodtak a formális matematikai kód helyett.
- Megjegyezték, hogy a Google megoldásai jelentősen olvashatóbbak voltak az emberek számára.
- Az OpenAI bonyolult formátumokat használt a bizonyításokhoz a Google strukturált jelentéseivel szemben.
- A használt modellek kísérleti jellegűek, és még nem érhetőek el nyilvános használatra.
Miért fontos?
Az IMO-szintű problémák megoldása jelentős előrelépést mutat az AI érvelési képességében és abban, hogy képes többlépcsős logikai bizonyításokat kezelni speciális kódnyelvek nélkül is. ---