Az Anthropic Claude 3.5 Sonnet új mércét állít fel a szoftvermérnöki feladatokban
Az Anthropic nemrég frissített Claude 3.5 Sonnet modellje új, a technológia jelenlegi állását képviselő 49%-os teljesítményt ért el az SWE-bench teszten, amely a valós szoftvermérnöki feladatokra összpontosít. Az eredmények mellett az Anthropic konkrét optimalizálási tippeket is adott a fejlesztőknek, akik a Claude-ot használják szoftverek építéséhez és hibák kijavításához.
- Rekordot jelentő 49%-os pontszámot ért el az SWE-bench Verified benchmark teszten
- Felülmúlta a többi vezető modellt a valós GitHub-problémák és összetett kódolási hibák megoldásában
- Továbbfejlesztett elemző eszközöket és JavaScript kódolási képességeket tettek elérhetővé a Claude felületén belül
- Konkrét tippeket osztottak meg a fejlesztőkkel a modell pontosságának javítására technikai környezetekben
Miért fontos?
A kódolás az LLM-ek egyik legkritikusabb és legpraktikusabb alkalmazási területe. A Claude folyamatos dominanciája ezen a területen megerősíti pozícióját, mint az automatizált szoftverfejlesztési munkafolyamatok preferált modellje.
Kapcsolódó hírek
Az Apple bemutatja a Ferret-UI 2-t az automatizált mobil- és webes feladatvégrehajtáshoz
2024. október 31.
Az Ideogram kiadja a Canvas-t a fejlett AI képszerkesztéshez és képkiterjesztéshez
2024. október 24.
A Runway bemutatja az Act-One eszközt a kifejező karakteranimációkhoz
2024. október 24.