ANTHROPIC
Az Anthropic kiadta a Claude Sonnet 4.6-ot, amely alacsonyabb áron hozza az Opus teljesítményét
Az Anthropic bevezette a Claude Sonnet 4.6-ot, a legújabb középkategóriás modelljét, amely a pénzügyi, számítógép-használati, kódolási és irodai teszteken az ár egyötödéért hozza vagy veri a zászlóshajó Opus 4.6 szintjét – miközben 1 millió tokenes kontextusablakkal rendelkezik.
- A kódolásra fókuszáló SWE-Bench Verified teszten a Sonnet 4.6 79,6%-ot ért el, ami alig marad el az Opus 4.6 80,8%-ától – miközben a futtatása ötször olcsóbb.
- A Sonnet 4.6 megelőzte az Opus 4.6-ot az ágens-alapú pénzügyi elemzésekben és az irodai feladatokat mérő teszteken, ami újdonság a középkategóriás Claude modell esetében.
- A Claude Code korai tesztelői az esetek 70%-ában preferálták a Sonnet 4.6-ot elődjével szemben, és 59%-ban az Opus 4.5-nél is jobbnak találták.
- A számítógép-használati képességek is tovább javulnak: a Sonnet OSWorld pontszámai a 2024 végi 15% alatti értékről 72,5%-ra ugrottak.
Miért fontos?
Az Anthropic elképesztő sebességgel alkalmazza a "lecsorgó" stratégiát, és alig néhány héttel a zászlóshajó frissítése után már a legolcsóbb sorozatában kínál az Opushoz mérhető képességeket. Mivel az erős kínai modellek továbbra is mindenkit alullicitálnak árban, a Sonnet 4.6 az Anthropic válasza a versenyre az ágens-robbanás tömegpiacán.