NOUS KUTATÁS
A Nous Research nyílt forráskódú AI-ja legyőzte az elit matematikai vizsgát
A Nous Research épp most tette nyílt forráskódúvá a Nomos 1-et, egy új, 30B paraméteres érvelési rendszert, amely 120-ból 87 pontot ért el a 2025-ös Putnam-versenyen — ezzel maga mögé utasítva az olyan riválisokat, mint a Qwen 3 az egyik legrangosabb egyetemi matematikai versenyen.
- A rendszer kétfázisú megközelítést alkalmaz: AI „munkások” oldják meg és kritizálják saját válaszaikat, majd egy bajnokság-stílusú rendszer választja ki a legjobb beküldést.
- A Nomos pontszáma tavaly a második helyre lett volna elég a közel 4000 emberi versenyző között, a modell pedig nyolc feladatra kapott maximális pontszámot.
- A Nous egy érvelési keretrendszert (reasoning harness) is közzétett és nyílt forráskódúvá tett — ez az az összehangoló kód, amely a modell feladatmegoldási folyamatát irányítja.
- A Qwen 3-at ugyanezen a keretrendszeren és beállításon futtatva mindössze 24/120 pontot ért el, ami azt mutatja, hogy a javulás a modell tanításából, nem pedig a keretrendszerből származik.
Miért fontos?
Nem is olyan régen még az egyszerű matematikai feladatok is gondot okoztak a legjobb AI rendszereknek — most pedig egy kicsi, nyílt modell győz le egy hírhedten nehéz vizsgát. A Nomos, a megoldatlan problémák leküzdését segítő AI, és az aranyérmes matematikai modellekkel előálló laborok között az egész terület készen áll egy AI-vezérelt fellendülésre. ---