A kínai SenseNova 5.0 AI-modell lekörözte a GPT-4 Turbo-t a benchmark teszteken
A kínai mesterséges intelligencia fejlesztések legújabb mérföldköveként a SenseTime technológiai vállalat hivatalosan is elindította a SenseNova 5.0-t. A nagyméretű nyelvi modell legfrissebb és egyben legjelentősebb frissítése komoly hullámokat vetett a tech világban, ugyanis a belsős mérési adatok alapján szinte minden kulcsfontosságú iparági benchmark teszten képes volt felülmúlni a piacvezető OpenAI által fejlesztett GPT-4 Turbo képességeit. Ez az áttörés új fejezetet nyithat a globális AI-versenyben, ahol eddig az amerikai tech óriások dominanciája tűnt megkérdőjelezhetetlennek.
A háttérben meghúzódó technikai specifikációk önmagukért beszélnek, és rávilágítanak arra, hogy a SenseTime mérnökei milyen elképesztő erőforrásokat mozgósítottak a projekt érdekében. A SenseNova 5.0 egy tekintélyes, megközelítőleg 600 milliárd paraméteres modell, amely lenyűgöző, 200 ezres kontextusablakkal rendelkezik. A fejlesztők a tanítási folyamat során több mint 10 terabájtnyi adatot használtak fel, amelynek döntő többsége szintetikus adat volt. Ennek a masszív adatmennyiségnek és a finomhangolásnak köszönhetően a rendszer rendkívül látványos fejlődést mutat az általános műveltség és tudás, a komplex matematika, a logikai következtetés, valamint a programozás és kódolás terén, magabiztosan utasítva maga mögé a jelenlegi csúcsmodelleket a főbb benchmark felületeken.
A SenseTime azonban nem áll meg a szöveges és logikai képességek fejlesztésénél, hanem a multimédiás irányba is komoly lépéseket tesz. A vállalat hivatalos közleménye szerint ugyanis hamarosan egy újabb nagy dobással jelentkeznek: egy olyan szöveg-videó, azaz text-to-video modellel, amely kiemelkedő stilisztikai konzisztenciával fog rendelkezni. Ez a megoldás előre beállított profilokkal teszi majd lehetővé a tartalomgyártást, ami forradalmasíthatja a digitális tartalomkészítést és a generatív videós platformok piacát.
A bejelentés és a SenseNova 5.0 elképesztő eredményei azért bírnak különösen nagy fontossággal, mert arra utalnak, hogy a kínai AI-szektor sokkal közelebb állhat az Egyesült Államokkal való közvetlen versenyhez, mint azt a nyugati elemzők korábban gondolták. Ugyanakkor a szakértők óvatosságra is intenek az adatok értékelésekor. Mivel egyelőre nem áll rendelkezésre széles körű nyilvános hozzáférés, amellyel a független fejlesztők és kutatók is tesztelhetnék a modell valós képességeit a mindennapi gyakorlatban, a marketingértékek mögötti valódiságot még sok ismeretlen tényező övezi. Az mindenesetre biztos, hogy a tech világ feszülten figyeli a SenseTime következő lépéseit.
- A ~600 milliárd paraméteres modell 200 ezres kontextusablakkal rendelkezik, és több mint 10 TB-nyi, nagyrészt szintetikus adaton tanították.
- A modell jelentős fejlődést mutat a tudás, a matematika, a logikai következtetés és a kódolás terén, túlszárnyalva olyan csúcsmodelleket, mint a GPT-4T a főbb benchmarkokon.
- A vállalat szerint hamarosan elérhető lesz egy stilisztikai konzisztenciával és előre beállított profilokkal rendelkező szöveg-videó (text-to-video) modell is.
A SenseNova 5.0 elképesztő eredményei a kulcsfontosságú benchmarkokon arra utalnak, hogy a kínai AI sokkal közelebb állhat az USA-val való versenyhez, mint azt korábban gondoltuk. Azonban nyilvános hozzáférés híján, amellyel tesztelhető lenne a modell képességeinek valódisága, még sok az ismeretlen tényező. ---