A Tencent új, „gyorsan gondolkodó” Hunyuan Turbo S modellje
A kínai technológiai óriás, a Tencent a napokban jelentette be legújabb fejlesztését, a Hunyuan Turbo S modellt, amely egy úgynevezett „gyorsan gondolkodó” mesterséges intelligencia. Az új modell tervezésekor a fejlesztők a mély, komplex következtetések helyett a villámgyors, azonnali válaszok biztosítására helyezték a hangsúlyt. Az eredmény magáért beszél: a Hunyuan Turbo S a gyakorlatban kétszeres sebességet képes elérni az előző generációhoz képest, miközben a legfontosabb teljesítményértékeléseken, azaz a benchmarkokon továbbra is hozza a piacvezető modellek szintjét. Ez a fejlesztés újabb mérföldkövet jelent a technológiai versenyben, ahol az azonnali válaszadási képesség kritikus jelentőséggel bír a felhasználói élmény szempontjából.
Bár a Turbo S esetében a sebesség volt a fő fejlesztési irány, a Tencent mérnökeinek sikerült elérniük, hogy a modell tudásbázis, matematikai feladatmegoldás és logikai következtetés terén is sikeresen vegye fel a versenyt a jelenlegi iparági etalonnak számító modellekkel, mint például a DeepSeek V3, az OpenAI-féle GPT-4o vagy az Anthropic 3.5 Sonnet modellje. A vállalat emellett jelentősen csökkentette az új modell API-költségeit is, így az már az előző generációhoz képest a töredékébe kerül, ami komoly vonzerőt jelenthet a fejlesztők és a vállalati felhasználók számára. A Tencent ráadásul itt nem áll meg: a vállalat már bejelentette egy kiegészítő, úgynevezett „mély gondolkodású” T1 modell érkezését is, így a jövőben a felhasználók a feladat jellegétől függően választhatnak a gyors, vagy az alaposabb, hosszabb időt igénylő következtetést végző modellek közül.
A megjelenés időzítése korántsem véletlen, hiszen a kínai AI-szektor jelenleg rendkívül intenzív versenyben áll. A DeepSeek globális sikere és folyamatos fejlesztései, valamint az Alibaba legutóbb bemutatott, kifejezetten logikai következtetésre szánt QwQ-Max modellje is jól mutatja, hogy milyen gyorsan változik a piac. A technológiai szakértők szerint a jelenlegi iparági trend a „gyorsan gondolkodó” és „lassan gondolkodó” modellek éles elkülönülését mutatja, ami alapjaiban formálja át az AI-alkalmazások működését. A legfontosabb tanulság talán az, hogy az amerikai chipkorlátozások ellenére a kínai laborok képesek fenntartani az innováció elképesztő tempóját, és a nemzetközi reflektorfényben lévő DeepSeek R1 sikere után a versenytársak is mindent megtesznek azért, hogy az iparág csúcsára törjenek, vagy legalábbis megelőzzék egymást a hatékonyság terén.
- A Turbo S a sebességre való fókuszálás ellenére felveszi a versenyt az olyan modellekkel, mint a DeepSeek V3, a GPT-4o és a 3.5 Sonnet a tudás, a matematika és a logikai következtetés terén.
- A Tencent jelentősen csökkentette az új modell árát, így az az előző generáció költségének töredékébe kerül.
- A vállalat egy kiegészítő, „mély gondolkodású” T1 következtetési modell elindítására is készül, a két modellt különböző felhasználási esetekre pozicionálva.
- A megjelenés a Kínából érkező fokozódó AI-verseny közepette történik, a DeepSeek újabb bevezetéshez közeledik, az Alibaba pedig a héten mutatta be a logikai következtetésre szánt QwQ-Max-ot.
Nem is olyan régen a következtetési (reasoning) modellek számítottak az új csodafegyvernek, most pedig már egy „gyorsan gondolkodó” kontra „lassan gondolkodó” megosztottságnál tartunk. Mivel a DeepSeek R1-ese hatalmas globális reflektorfényt irányított a kínai AI-ra, a rivális laborok gyorsan igyekeznek túllicitálni az iparág kedvencét – és az amerikai chipkorlátozások úgy tűnik, semmit sem lassítanak le.