A FRONTVONALRÓL
Az OpenAI bemutatta az o3 logikai modellt, amely csúcsteljesítményt nyújt a benchmarkokon
Az OpenAI hivatalosan is bejelentette az o3-at, a következő generációs logikai modelljét, amely jelentősen felülmúlja elődjét, az o1-et és más vezető modelleket a kódolás, a matematika és a természettudományok terén. A modell példátlan képességeket mutat olyan komplex, új problémák megoldásában, amelyek nem szerepeltek az eredeti tanítási adatai között. Míg a biztonsági tesztelők már most jelentkezhetnek a korai hozzáférésre, egy kisebb verzió, az o3-mini január elején várható, amelyet rövid időn belül követ majd a teljes o3 változat.
- Több mint 20 ponttal veri az o1-et a legfontosabb kódolási benchmarkokon.
- A programozók felső 99,2 százalékába került a Codeforces kódolási versenyen 2727-es pontszámmal.
- 87,7%-os eredményt ért el a PhD-szintű tudományos kérdésekben, ami közel 10 ponttal magasabb, mint az előző modellé.
- Több mint 25%-ot ért el az Epoch AI matematikai benchmarkján, amely nem publikált és teljesen új problémákat tartalmaz.
- Ez az első modell, amely átlag feletti emberi pontszámot ért el az Arc AGI teszten.
Miért fontos?
Az o3 kiadása azt sugallja, hogy az OpenAI egyre közelebb kerül az általános mesterséges intelligenciához (AGI) azáltal, hogy olyan modelleket hoz létre, amelyek képesek teljesen új forgatókönyvek mentén logikusan gondolkodni, ahelyett, hogy csak a tanítási adatok mintáit ismételnék. ---