Új Core multimodális AI modellt mutatott be a Reka
A mesterséges intelligencia fejlesztésével foglalkozó Reka startup a napokban jelentette be legújabb fejlesztését, a Reka Core-t, amely egy kiemelkedő képességű multimodális nagy nyelvi modell (LLM). Az újdonság különlegessége, hogy nem csupán szöveges adatok feldolgozására képes, hanem egyszerre kezeli a képi, hang- és videóbemeneteket is, mindezt olyan teljesítményszinten, amely a független beszámolók szerint eléri, sőt bizonyos területeken meg is haladja a jelenlegi iparági csúcsmodellek képességeit. A modell bemutatkozása jelentős mérföldkőnek számít, hiszen a Reka Core képes felvenni a versenyt a piacot uraló megoldásokkal, ami tovább élezi a versenyt az AI-fejlesztők között.
A technológiai háttérről szólva érdemes kiemelni, hogy a Reka Core modellt a semmiből építették fel kevesebb mint egy év alatt. A fejlesztés során a csapat kizárólag nyilvánosan elérhető, licencelt, valamint szintetikus adatokat használt fel a tanításhoz. A modell egyik legfontosabb technikai paramétere a 128 000 tokenes kontextusablak, amely lehetővé teszi, hogy a rendszer egyszerre nagy mennyiségű információt elemezzen és tartson fejben. Emellett a modell komoly többnyelvű támogatással is rendelkezik, hiszen összesen 32 nyelven kínálja fejlett képességeit, ezzel is biztosítva a szélesebb körű nemzetközi felhasználhatóságot. A fejlesztői csapatot korábbi, a területen komoly tapasztalattal rendelkező DeepMind és Meta kutatók alkotják, akik olyan stratégiai partnerekkel működnek együtt, mint az Oracle és a Snowflake, biztosítva ezzel a modell elérését és integrációját az üzleti szférában.
A Reka Core teljesítménye különösen látványos a különböző összehasonlító teszteken. A multimodális emberi értékelések során a modell képes volt felülmúlni az Anthropic által fejlesztett Claude 3 Opus modellt, míg a videós feladatok feldolgozása közben a Google Gemini Ultra modelljét utasította maga mögé. A képértelmezési feladatokban a GPT-4-gyel is versenyképesnek bizonyult, ami világosan mutatja a technológia érettségét. A Reka sikere azért különösen figyelemreméltó, mert egy viszonylag rövid fejlesztési idő alatt sikerült elérniük azokat az átfogó képességeket, amelyekért a versenytársak sokszor több évet és nagyságrendekkel nagyobb erőforrásokat mozgattak meg. Ezzel a fejlesztéssel a Reka egyértelműen bejelentkezett a piac meghatározó szereplői közé, új színt és dinamikát hozva az AI-fejlesztések globális versenyébe.
- A Reka Core-t a semmiből képezték ki kevesebb mint egy év alatt, nyilvánosan elérhető, licencelt és szintetikus adatok felhasználásával.
- A modell 128 000 tokenes kontextusablakkal rendelkezik, valamint 32 nyelven kínál többnyelvű képességeket.
- A Core felülmúlta a Claude 3 Opus-t a multimodális emberi értékeléseken, legyőzte a Gemini Ultra-t videós feladatokban, és versenyképesnek bizonyult a GPT-4-gyel a képértelmezés terén.
- A Reka-t korábbi DeepMind és Meta kutatók alapították, és olyan vállalatokkal működik együtt, mint az Oracle és a Snowflake.
A Reka Core mérési eredményei rendkívül lenyűgözőek – és a semmiből versenyre kelni a csúcsmodellekkel nem kis teljesítmény. A rövid tanítási idő alatt elért átfogó multimodális képességekkel egy újabb jelentős szereplő jelentkezhetett be, nem is akárhogyan. ---