AI MODELLEK
Az Anthropic kiadta a Claude Opus 4.5-öt rekorddöntő kódolási teljesítménnyel
Az Anthropic elindította új zászlóshajó modelljét, a Claude Opus 4.5-öt, amelyet úgy terveztek, hogy okosabb és gyorsabb legyen elődeinél. A modell az első helyet érte el az SWE-bench Verified ranglistán 80,9%-os eredménnyel, megelőzve az olyan versenytársakat, mint a GPT-5.1 és a Gemini 3 Pro. Az Anthropic szerint a modell egy hírhedten nehéz mérnöki otthoni vizsgán is túlszárnyalt minden emberi jelöltet egy kétórás időkereten belül. A teljesítménynövekedés mellett az Anthropic 5/25 dollárra csökkentette az árat egymillió tokenenként, és bevezetett egy kontextus-tömörítési funkciót, amely szinte végtelen csevegési munkamenetet tesz lehetővé a kontextushatárok elérése nélkül. A fejlesztők mostantól a Claude Code-ot is használhatják asztali gépen terminál-alapú interakciókhoz.
- Bevezettek egy új „effort” (erőkifejtés) paramétert, amely lehetővé teszi a fejlesztők számára, hogy válasszanak a sebesség és a magas intelligenciájú módok között.
- Közepes erőkifejtés mellett a modell hozza a Sonnet 4.5 legjobb pontszámait, miközben 76%-kal kevesebb tokent használ.
- Állításuk szerint ez az iparág legellenállóbb modellje a jailbreaking és a prompt injection támadásokkal szemben.
- Képes volt kreatív kiskapukat találni összetett szimulációkban, például repülési osztályok módosításával kerülte meg a légitársasági szabályzatokat.
- Az API hozzáféréshez a claude-opus-4-5-20251101 modell-stringet tartalmazza.
Miért fontos?
Ha az Anthropic benchmarkjai a való világban is megállják a helyüket, az Opus 4.5 valódi szintlépést jelent abban, amire az AI autonóm módon képes. Várható, hogy a fejlesztők ambiciózusabb ágens-alapú alkalmazásokat kezdenek építeni, és a versenytársak gyors válaszára is számíthatunk. ---