AI MATHEMATICS
A DeepMind és az OpenAI modelljei aranyérmes szintet értek el a matematikai olimpián
A DeepMind egy olyan modellt épített, amely aranyérmes szintet ért el a Nemzetközi Matematikai Diákolimpián (IMO). Az OpenAI is aranyérmet igényelt, bár az ő eredményüket az IMO nem hitelesítette. Az IMO a világ legrangosabb versenye fiatal matematikusok számára, és a megoldandó feladatok rendkívül nehezek. Az a tény, hogy két vezető vállalat is aranyérmet szerzett, nagy jelentőségű – különösen mivel mindkét cég alapvetően általános célú rendszerekkel érte el ezt.
- A Google a Gemini Deep Think egy fejlett verzióját használta a hat IMO-feladatból öt megoldásához.
- A modell végig természetes nyelven működött, és közvetlenül a hivatalos feladatleírásokból készített szigorú matematikai bizonyításokat.
- A megoldások a hivatalos 4,5 órás versenyidőn belül születtek meg.
- A DeepMind 35 pontot ért el, szemben a legjobban teljesítő emberi résztvevők 42 pontjával.
- Ez jelentős előrelépést jelent a korábbi években használt speciális AlphaProof és AlphaGeometry rendszerekhez képest.