TENCENT
A Tencent bemutatja a hibrid Hunyuan T1 következtető AI-t
A Tencent épp most adta ki a Hunyuan T1-et, egy új következtető modellt, amely teljesítményben és árban is felveszi a versenyt a DeepSeek R1-gyel – miközben az iparág első hibrid Transformer-Mamba architektúráját használja a jobb hatékonyság érdekében.
- A T1 felveszi a versenyt, vagy meg is haladja az olyan riválisokat, mint a DeepSeek R1 és az OpenAI o1 és GPT 4.5 a benchmarkokon, különösen matematikában és kínai nyelvi értékelésekben jeleskedve.
- A Tencent állítása szerint a modell az első, amely ötvözi a Google Transformer architektúráját a Carnegie Mellon és Princeton kutatóinak Mamba rendszerével.
- A hibrid megközelítés állítólag kétszer gyorsabb sebességet biztosít, miközben csökkenti a számítási igényeket, különösen hosszú szövegű következtetési feladatok kezelésekor.
- Ami az árakat illeti, a T1 felveszi a versenyt a DeepSeek versenyképes áraival: 1 jüan (0,14 dollár) millió token bemenetenként és 4 jüan (0,55 dollár) millió token kimenetenként.
Miért fontos?
Miután a DeepSeek, a Tencent és az Alibaba is ott van a porondon, Kína AI laborjai szinte teljesen behozták a lemaradást az amerikai vezetőkhöz képest – ami alig egy éve még rendkívül távolinak tűnt. A hamarosan érkező következő generációs R2-vel Kína közelebb érzi magát, mint valaha ahhoz, hogy hivatalosan is átvegye a vezetést a világ legjobb AI modelljeinek terén. ---