GOOGLE
A Google Gemini visszaszerezte az első helyet az LM Arena ranglistáján
A Google legújabb kísérleti Gemini modellje (1121) visszavette a vezetést az LM Arena AI teljesítmény-ranglistáján, ami már a harmadik helycsere az OpenAI és a Google között az elmúlt egy héten.
- A Google új Gemini-exp-1121 modellje jelentős javulást mutat a kulcsfontosságú mutatókban, első helyet szerezve a kódolás, a matematika, a kreatív írás és a nehéz promptok kategóriájában.
- A gyors egymásutánban érkező frissítések sorát a Google 1114-es verziója nyitotta meg november 14-én, amelyet napokkal később az „anonymous-chatbot” (a frissített GPT-4o) követett.
- A Gemini legújabb változata 20 pontot javult elődjéhez képest, megerősítve pozícióját a vizuális feladatokban, miközben javította érvelési képességeit.
- Az OpenAI frissítése a kreatív írásra és a fájlkezelési képességekre összpontosított, bár az új elemzések bizonyos teszteken sebességnövekedést is mutatnak.
Miért fontos?
Ha már az OpenAI és a Google adok-kapok harcáról beszélünk, ez a rivalizálás az LLM ranglistákon is folytatódik. Az OpenAI korábban folyamatos frissítésekkel őrizte vezető helyét, de úgy tűnik, a Google is felpörgette a fejlesztési tempót. Ahogy mondani szokás: teher alatt nő a pálma, és ez igaz a csatatéren és az LM Arena-ban is. ---