Az Anthropic Sonnet 5-öse a Fable árnyékában érkezik
Az Anthropic a napokban bejelentette legújabb modellcsaládjának középső tagját, a Sonnet 5-öt, amelyet a vállalat az eddigi leginkább ágensi képességekkel felvértezett Sonnet modellként jellemez. A megjelenés időzítése azonban rendkívül sajátos, hiszen a modell éppen akkor érkezett meg a piacra, amikor az amerikai Kereskedelmi Minisztérium egy közel háromhetes korlátozást követően feloldotta a nagyobb teljesítményű, zászlóshajónak számító Mythos 5 és Fable 5 modellek exportellenőrzését. Bár a Sonnet 5 a maga kategóriájában ígéretes, rendkívül alkalmas és költséghatékony megoldásnak számít, debütálása óhatatlanul a nagytestvérek árnyékában történt, ami kissé beárnyékolja az újdonság piaci fogadtatását.
A Sonnet 5 technológiai szempontból jelentős előrelépést képvisel elődjéhez, a Sonnet 4.6-hoz képest, különösen az ágensi kódolás és a komplex logikai következtetések területén. A fejlesztéseknek köszönhetően a modell képes olyan fejlett szellemi munkát igénylő feladatok elvégzésére, amelyek bizonyos tekintetben még a korábbi csúcsmodell, az Opus 4.8 képességeit is meghaladják. Az új architektúra egyik legfontosabb erénye, hogy képes önállóan kezelni böngészőt vagy terminált, ezáltal olyan automatizált, ágensi viselkedésmintákat tesz elérhetővé az Anthropic olcsóbb árkategóriájú kínálatában, amelyek korábban csak a jóval drágább megoldásoknál voltak megszokottak. Érdekesség ugyanakkor, hogy a kiberbiztonsági teljesítménymutatók tekintetében a modell gyengébb eredményeket mutat, mint a 4.6-os verzió. Az Anthropic álláspontja szerint ez annak tudható be, hogy a Sonnet 5-öt nem képezték szándékosan kiberbiztonsági feladatokra, ami egyértelműen jelzi a vállalat prioritásainak eltolódását.
A piaci jelentőségét tekintve a Sonnet 5 elérhetősége minden előfizető számára biztosított, az API árazását pedig úgy alakították ki, hogy az augusztus 31-ig tartó bevezető időszakban 2 dollár a bemeneti és 10 dollár a kimeneti tokenek milliója, amely szeptembertől 3 és 15 dollárra emelkedik. Bár a technikai fejlődés vitathatatlan, a közhangulat mégis felemás a kiadással kapcsolatban. Sokan kritizálják a modellt a kiberbiztonsági gyengeségek miatt, és a fejlesztést inkább egyfajta kényszermegoldásnak tekintik a Fable és Mythos modellek körüli hosszas, vállalatot érintő hatósági hercehurca után. Míg az Anthropic a „benchmaxxing” vádjával szembesül, a Sonnet 5 egyelőre inkább tűnik a piaci körülmények áldozatának, mintsem egy átütő erejű, önálló technológiai mérföldkőnek. A felhasználók számára most az a kérdés, hogy a modell ágensi képességei elegendőek-e ahhoz, hogy feledtessék a zászlóshajók körüli technikai és politikai bizonytalanságokat.
- A Sonnet 5 jelentős ugrást mutat az ágensi kódolásban és következtetésben az elődjéhez képest, olyan szellemi munkára való képességekkel, amelyek még az Opus 4.8-at is felülmúlják.
- Az új Sonnet képes böngészőt vagy terminált kezelni és hosszabb feladatokat futtatni, ezzel több Opus-stílusú ágensi viselkedést hozva az Anthropic olcsóbb kategóriájába.
- A modell kiberbiztonsági teljesítménymutatói rosszabbak lettek, mint a Sonnet 4.6 esetében; az Anthropic közlése szerint „nem képezték szándékosan” az 5-öst kiberbiztonsági feladatokra.
- A Sonnet 5 minden előfizetésben elérhető, az API árak augusztus 31-ig egymillió bemeneti/kimeneti tokenenként 2/10 dollárba, utána pedig 3/15 dollárba kerülnek.
Ez egy frissítés a 4.6-hoz képest, de a Fable után vágyódó felhasználók háttere miatt ez a „5-ös” osztály kissé csalódást keltő kezdetének tűnik. Sok kiadást vádolnak „benchmaxxinggal”, de a Sonnet a kiberbiztonság terén épp az ellenkezőjének tűnik — egy kellemetlen, közvetlen következménye annak a Fable és Mythos körüli hercehurcának, amelybe a vállalat keveredett. ---