A Nous Research nyílt forráskódú AI-ja legyőzte az elit matematikai vizsgát

2025. december 11. · MI Történik? · 1 perc olvasás

A Nous Research épp most tette nyílt forráskódúvá a Nomos 1-et, egy új, 30B paraméteres érvelési rendszert, amely 120-ból 87 pontot ért el a 2025-ös Putnam-versenyen — ezzel maga mögé utasítva az olyan riválisokat, mint a Qwen 3 az egyik legrangosabb egyetemi matematikai versenyen.

A rendszer kétfázisú megközelítést alkalmaz: AI „munkások” oldják meg és kritizálják saját válaszaikat, majd egy bajnokság-stílusú rendszer választja ki a legjobb beküldést.
A Nomos pontszáma tavaly a második helyre lett volna elég a közel 4000 emberi versenyző között, a modell pedig nyolc feladatra kapott maximális pontszámot.
A Nous egy érvelési keretrendszert (reasoning harness) is közzétett és nyílt forráskódúvá tett — ez az az összehangoló kód, amely a modell feladatmegoldási folyamatát irányítja.
A Qwen 3-at ugyanezen a keretrendszeren és beállításon futtatva mindössze 24/120 pontot ért el, ami azt mutatja, hogy a javulás a modell tanításából, nem pedig a keretrendszerből származik.

Miért fontos?

Nem is olyan régen még az egyszerű matematikai feladatok is gondot okoztak a legjobb AI rendszereknek — most pedig egy kicsi, nyílt modell győz le egy hírhedten nehéz vizsgát. A Nomos, a megoldatlan problémák leküzdését segítő AI, és az aranyérmes matematikai modellekkel előálló laborok között az egész terület készen áll egy AI-vezérelt fellendülésre. ---

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

Heti cél ellenőrző sablon létrehozása ChatGPT-vel

1 órája

A Claude Opus 5 lenyűgöz egy 8 oldalas munkafüzet elemzésével

1 órája

Új Claude Code Skill Kézírást Digitális Betűtípussá Alakít

2 órája