GEMINI
A Google két frissített Gemini 1.5 modellt adott ki továbbfejlesztett matematikai képességekkel
A Google két új, továbbfejlesztett Gemini 1.5 verziót tett közzé a Gemini API-n keresztül: az 1.5 pro-002-t, amely kiemelkedő (state-of-the-art) eredményeket ért el a matematikai benchmark teszteken, valamint az 1.5-flash-002-t, amely jelentős fejlődést mutat az utasításkövetés terén. Logan Kilpatrick megjegyezte, hogy ezek már produkcióra kész modellek, amelyeknél a sebességi korlátok (rate limits) javítására, az 1.5 Pro árazására és az alapértelmezés szerint bekapcsolt szűrőbeállításokra összpontosítottak. A benchmarkokon látható lineáris, esetenként exponenciális fejlődés célja, hogy a fejlesztők még több olyan dolgot építhessenek, ami lelkesíti őket, különösen a matematika és a kódolás területén.
- Az 1.5 pro-002 kiemelkedő teljesítményt nyújtott az olyan matematikai benchmarkokon, mint az AMC és az AIME 24.
- Az 1.5-flash-002 jelentős javulást mutat az utasításkövetés (instruction following) terén.
- Megnövelt sebességi korlátokat és módosított árazást vezettek be az 1.5 Pro modellhez.
- Az új szűrőbeállítások alapértelmezés szerint engedélyezve vannak a fejlesztői élmény egyszerűsítése érdekében.
- A modellek jelentős előrelépést mutatnak a kódolási képességek terén a fejlesztői ökoszisztéma számára.
Miért fontos?
A Google új Gemini 1.5-pro-002 modellje kimagasló teljesítményt ér el az olyan nehéz matematikai teszteken, mint az AMC + AIME 24 és a MATH. Ez azt jelenti, hogy a modell képes olyan összetett matematikai problémák és feladatok megoldására, amelyek mély szakmai ismereteket igényelnek – ez komoly akadályt jelentett a legtöbb korábbi AI modell számára.