TODAY IN AI
A ByteDance bemutatta a Seed-Thinking-v1.5 érvelő modellt az OpenAI o1 ellenfeleként
A TikTok anyavállalata, a ByteDance közzétett egy technikai tanulmányt a Seed-Thinking-v1.5-ről, egy új „érvelő” LLM-ről, amelyet az OpenAI o1 és a DeepSeek R1 közvetlen versenytársának szánnak. A modell mixture-of-experts architektúrát használ, amely a 200 milliárd paraméteréből egyszerre csak 20 milliárdot aktivál. A ByteDance állítása szerint a modell a legtöbb gazdaságilag értékes feladatban felülmúlja az embereket. A jelentések szerint legyőzi a DeepSeek R1-et, sőt bizonyos benchmarkokon — mint például az ARC-AGI, amely a mesterséges általános intelligencia felé tett haladást méri — még a Gemini 2.5 Pro-t és az o3-mini-high-t is megelőzi.
- A modell mixture-of-experts architektúrát használ, összesen 200 milliárd paraméterrel.
- Tokenenként mindössze 20 milliárd paramétert aktivál a hatékonyság és a sebesség optimalizálása érdekében.
- A benchmark eredmények szerint felülmúlja a DeepSeek R1-et és vetekszik a Gemini 2.5 Pro-val.
- Kiváló teljesítményt mutatott az ARC-AGI-n, amely az emberihez hasonló érvelési feladatokra összpontosít.
Miért fontos?
A ByteDance belépése a magas szintű érvelő modellek piacára azt jelzi, hogy a fejlett AI-logikáért folyó verseny már túlmutat az amerikai laboratóriumokon, és globális technológiai óriások csatájává válik. ---