MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az OpenAI kiadatlan modellje megoldotta a valaha készült legnehezebb AI matematikai teszt felét

Tizenegy neves matematikus, köztük egy Fields-érmes, létrehozta a "First Proof" nevű tesztet: 10 nem publikált, kutatási szintű matematikai problémát saját munkájukból, hogy az AI érvelési képességét internetes rövidítések vagy tréningadatok nélkül teszteljék. Az OpenAI vezető kutatója, Jakub Pachocki arról számolt be, hogy egy belső, kiadatlan modell valószínűleg legalább 5-öt megoldott a 10 feladatból. Míg a nyilvános modellek, mint a ChatGPT és a Gemini csak 2-t tudtak teljesíteni, a kiadatlan modell nyers matematikai érvelést mutatott 10 részterületen, az algebrai topológiától a szimplektikus geometriáig. Ugyanezen a napon az OpenAI közzétett egy fizikai preprint tanulmányt, amelyben a GPT-5.2 egy olyan formulát javasolt a gluon részecskék kölcsönhatására, amelyet a fizikusok évtizedekig lehetetlennek tartottak. A Harvard és a Cambridge kutatói igazolták az áttörést, amelyet a UC Santa Barbara professzora tudományos folyóirat szintű kutatásként írt le, amely tágítja az elméleti fizika határait. A First Proof feladatok következő köre március 14-re várható.
Miért fontos?

Az "AI nem képes tudományra" szemléletváltás az "AI tudományt művel" irányba felgyorsult. Ezek az eredmények azt sugallják, hogy az AI túllép az információkeresésen az eredeti tudományos és matematikai felfedezések világába, potenciálisan évtizedes elméleti fizikai problémákat oldva meg. ---

Eredeti forrás megtekintése (angol) →