AI MODELLEK
Az OpenAI, a Google és az Alibaba gyorsabb és hatékonyabb kis AI modelleket indított el
Az elmúlt 24 órában három nagy szereplő is új modelleket mutatott be, amelyek a nyers intelligencia helyett a sebességre és a hatékonyságra összpontosítanak. A Google kiadta a Gemini 3.1 Flash-Lite modellt, az OpenAI elindította a GPT-5.3 Instant-ot, az Alibaba pedig négy Qwen 3.5 Small modellt tett elérhetővé, amelyeket eszközön belüli használatra terveztek. Ezeket a modelleket sebességre, alacsony költségre és kisebb hardvereken való futtatásra optimalizálták. Az OpenAI a GPT-5.3 Instant-ot olyan valós idejű alkalmazásokhoz építette, ahol a késleltetés kritikus, míg a Google a vállalati léptéket célozta meg ultra-alacsony token-árazással. Az Alibaba Qwen modelljei helyileg futtathatók telefonokon vagy laptopokon, felhőigény nélkül.
- GPT-5.3 Instant: 26,8%-kal csökkentett hallucináció a webes kereséssel, és kevésbé „kioktató” hangnem.
- Gemini 3.1 Flash-Lite: 2,5-szer gyorsabb válaszidő az első tokenig, és 0,25 dolláros ár egymillió bemeneti tokenenként.
- Qwen 3.5 Small: 0,8B és 9B közötti paraméterszámú modellek, amelyek ingyenesen futtathatók helyi gépeken.
- A Google Flash-Lite modellje állítható „gondolkodási szinteket” tartalmaz a fejlesztők számára a következtetési képesség finomhangolásához.
- A GPT-5.2 Instant kivezetését 2026. június 3-ra tervezik.
Miért fontos?
Így néz ki, amikor az AI infrastruktúrává válik. Senki nem dicsekszik azzal, hogy milyen erős az elektromos árama; az embereket az érdekli, hogy olcsó, megbízható és mindenhol ott legyen. Még nem tartunk teljesen az „unalmas közmű” fázisban, de már látszik a folyamat az iparágban. ---