AI Benchmarking
A Gemini 2.5 vezet az AI benchmarkokban új funkciókkal
A Gemini 2.5 a Google I/O központi eleme volt, és szinte minden jelentős AI benchmarkot felülmúlt: a kódolástól és webfejlesztéstől kezdve a komplex érvelésig és videóértelmezésig. A vezető kereskedelmi modellekhez képest kiemelkedik 2025 januári tudásfrissítési határával, 1 millió tokenes kontextusablakával, és az OpenAI GPT-4o költségének körülbelül negyedéért üzemel. A Gemini Diffusion "tiszta zajnak" minősülő szöveggel kezdődik, majd fokozatosan alakítja át a véletlenszerű bemenetet koherens és kontextuálisan pontos természetes nyelvé, a kívánt promptnak megfelelően.
- Deep Think: Egy fejlett érvelési képesség, amely komplex matematikai és programozási feladatokban éri el a legmodernebb eredményeket, bár megnövekedett költségekkel és késleltetéssel jár.
- Fejlesztett function calling és strukturált kimenetek: A valós idejű Gemini modellek mostantól támogatják a function callingot és a strukturált kimenetet, kezelve a korábbi korlátozásokat.
- Gemini Diffusion: Egy új funkció, amely 5-ször gyorsabban generál szöveget, mint a vezető Flash Lite modell, a diffúziós modelleket szöveggenerálásra használó friss kutatásokra alapozva.