LLM FRISSÍTÉSEK
Az Anthropic kiadta a Claude Opus 4.5-öt, új teljesítmény-benchmarkokat felállítva
Az Anthropic a Claude Opus 4.5 kiadásával ismét átvette a vezetést a kódolási teljesítmény terén. A modellt a világ elsőszámú kódolási modelljeként pozícionálják, külön kiemelve, hogy átlépte a 80%-os küszöböt az SWE-Bench Verified teszten. A nyers teljesítményen túl a modell lényegesen hatékonyabb elődeinél, magas szintű logikai következtetési képességeket kínálva jelentősen alacsonyabb áron a felhasználók és fejlesztők számára.
- Átlépi a 80%-ot az SWE-Bench Verified teszten összetett kódolási feladatoknál
- Az ára háromszor olcsóbb, mint a korábbi Opus modelleké
- A közepes logikai (reasoning) mód hozza a Sonnet 4.5 teljesítményét, miközben 76%-kal kevesebb tokent használ
- Javult logikát mutat a többjátékos szobák létrehozása és a szoftverarchitektúra-feladatok során
Miért fontos?
Ez a kiadás elérhetőbbé és megfizethetőbbé teszi a csúcskategóriás logikai következtetést, ami potenciálisan megváltoztathatja a csúcsmodellek alkalmazásának gazdaságosságát a vállalati szintű szoftverfejlesztésben. ---