NEXT IN AI
Az Anthropic kiadta a Claude 3.5 Sonnet modellt, hogy lekörözze a GPT-4o-t
Ki tudna ellenállni egy Dávid és Góliát történetnek? Az Anthropic nevű AI startup becslések szerint 375 alkalmazottal rendelkezik. A DeepMind több mint 2500-zal. És miközben az OpenAI értéke már meghaladja a 80 milliárd dollárt, az Anthropic állítólag ennek csak körülbelül a negyedét éri.
Ezért is lenyűgöző, hogy a hároméves startup éppen most adott ki egy új modellt, a Claude 3.5 Sonnetet, amely állítása szerint képes felülmúlni versenytársait. A benchmarkok köztudottan megbízhatatlanok — még mindig nincs szabványosított módszer a modellek pontosságának és hatékonyságának mérésére. De minden jel arra mutat, hogy az Anthropic legújabb kiadása több kulcsfontosságú szöveg- és látásalapú mérőszámban is jobban teljesít, mint a Gemini 1.5 Pro és a sokat emlegetett GPT-4o.
Kinek készült? A Claude a piac legirodalmibb és legintellektuálisabb modelljeként szerzett hírnevet — az első számú választás azok számára, akik kreatív vagy írásigényes projekteken dolgoznak. A vállalatokat is kiszolgálja azáltal, hogy lehetővé teszi a modellek fine-tune-olását konkrét célokra.
Mi a helyzet a névvel? A cég általában hármas csoportba osztja modelljeit: ott van a kompakt, hatékonyságorientált Haiku, a kiegyensúlyozott Sonnet és az erőműnek számító Opus. Ebben az esetben csak az új Sonnet modellt adják ki, a Haiku és az Opus feltehetően hamarosan érkezik.
- A Claude mostantól jobb a matematikában, az érvelésben és a kódgenerálásban.
- A modell állítólag 80%-kal olcsóbb és kétszer olyan gyors, mint a Claude 3 Opus.
- Az új „Artifacts” funkció lehetővé teszi a felhasználók számára a szövegek és képek közvetlen módosítását a platformon belül.
- A frissítés híd szerepbe helyezi a Claude-ot a chatbotok, a szövegszerkesztők és a képszerkesztők között.
Miért fontos?
Az Anthropic nem dőlhet hátra túl sokáig a dicséreteket élvezve. Bár lenyűgöző, az új modell csak néhány lépéssel jár a riválisai előtt — ez még nem egy hatalmas ugrás. Az AI rajongók továbbra is olyan platformra vágynak, amely valóban a következő szintre emeli a dolgokat, például képes a multitaskingra vagy magas szintű logikai problémák megoldására. ---