Az Anthropic Claude 3.5 Sonnet új mércét állít fel a szoftvermérnöki feladatokban

2024. október 31. · MI Történik? · 1 perc olvasás

Az Anthropic nemrég frissített Claude 3.5 Sonnet modellje új, a technológia jelenlegi állását képviselő 49%-os teljesítményt ért el az SWE-bench teszten, amely a valós szoftvermérnöki feladatokra összpontosít. Az eredmények mellett az Anthropic konkrét optimalizálási tippeket is adott a fejlesztőknek, akik a Claude-ot használják szoftverek építéséhez és hibák kijavításához.

Rekordot jelentő 49%-os pontszámot ért el az SWE-bench Verified benchmark teszten
Felülmúlta a többi vezető modellt a valós GitHub-problémák és összetett kódolási hibák megoldásában
Továbbfejlesztett elemző eszközöket és JavaScript kódolási képességeket tettek elérhetővé a Claude felületén belül
Konkrét tippeket osztottak meg a fejlesztőkkel a modell pontosságának javítására technikai környezetekben

Miért fontos?

A kódolás az LLM-ek egyik legkritikusabb és legpraktikusabb alkalmazási területe. A Claude folyamatos dominanciája ezen a területen megerősíti pozícióját, mint az automatizált szoftverfejlesztési munkafolyamatok preferált modellje.

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

Az Apple bemutatja a Ferret-UI 2-t az automatizált mobil- és webes feladatvégrehajtáshoz

2024. október 31.

A Runway bemutatja az Act-One eszközt a kifejező karakteranimációkhoz

2024. október 24.

Az Ideogram kiadja a Canvas-t a fejlett AI képszerkesztéshez és képkiterjesztéshez

2024. október 24.

Tudj meg többet

Claude AI: Az Anthropic chatbotja amit kevesen ismernek Magyarországon

ChatGPT vs Claude vs Gemini - Melyiket válaszd 2026-ban?