Az Amazon kiadta a Nova AI modellcsaládot szöveg-, kép- és videógenerálásra
Az Amazon a napokban hivatalosan is bejelentette a Nova nevű vadonatúj AI-modellcsaládját, amely átfogó szöveg-, kép- és videógenerálási képességekkel érkezik a piacra. Ez a stratégiai lépés a tech- és kiskereskedelmi óriás eddigi legmeghatározóbb mérföldköve a fogyasztói GenAI szegmensben, amellyel egyértelműen jelzi növekvő dominanciáját. Az új modellek bevezetésével az Amazon közvetlenül beszáll a legfejlettebb technológiai megoldások versenyébe, átformálva a piac jelenlegi erőviszonyait.
A Nova termékcsalád rendkívül sokoldalú felhozatallal büszkélkedhet, amely négy különböző kapacitású szöveges modellt foglal magában: a hatékony Micro, a kiegyensúlyozott Lite, a nagyteljesítményű Pro, valamint a csúcskategóriás Premier variánsokat. A multimodális képességeket a Canvas képalkotó, valamint a Reel elnevezésű videógeneráló modellek teszik teljessé. A fejlesztők számára különösen vonzó lehet, hogy a Nova Pro a teljesítménytesztek, vagyis a különböző benchmarkok során teljesen egyenrangú félként versenyzett a piacvezető frontier modellekkel, sőt a tesztelési fázisban olyan neves riválisokat is maga mögé utasított, mint a GPT-4o, a Mistral Large 2 és a Llama 3. A szöveges modellek nemzetközi téren is kiemelkedőek, mivel több mint 200 nyelv támogatásával és egy hatalmas, jelenleg 300 000 tokenes kontextusablakkal rendelkeznek. Ezt a kapacitást az Amazon a tervek szerint 2025-ben 2 millió token fölé fogja terjeszteni. A mozgóképes fronton bevetett Amazon Reel jelenleg hat másodperces videókat képes generálni egyszerű szöveges vagy képi promptekből, ám a fejlesztések nem állnak meg: az előttünk álló hónapokban a maximális hosszúság várhatóan akár két percre is kibővül. A jövőbeli ütemterv szintén tartogat meglepetéseket, hiszen a vállalat elárulta, hogy 2025-ben beszéd-beszéd (speech-to-speech) és komplex, „bármiből-bármit” (any-to-any) modalitású modellekkel egészítik ki a palettát.
Az iparági elemzők számára eddig úgy tűnhetett, hogy az Amazon némileg lemaradt az AI-verseny kezdeti futamában, de ez a mostani termékbevezetés alapjaiban írja felül a korábbi feltételezéseket. A vállalat globális méretű, kiterjedt ügyfélbázisával, valamint a mögötte álló, szinte korlátlan anyagi és infrastrukturális erőforrásaival olyan hátteret biztosít, amellyel kevesen versenyezhetnek. A most bemutatott, rendkívül hatékony és versenyképes modellcsalád révén a kiskereskedelmi óriás egy igazi sötét lóként lépett elő a háttérből, amely a következő időszakban rendkívül gyorsan felkapaszkodhat az AI-ranglétra legtetejére, átvéve az irányítást a technológiai forradalom újabb hulláma felett.
- A Nova választéka négy különböző képességű szöveges modellt (Micro, Lite, Pro és Premier), valamint Canvas (kép) és Reel (videó) modelleket tartalmaz.
- A Nova Pro versenyképes a vezető frontier modellekkel a teljesítményteszteken (benchmarks), a tesztelés során megelőzve olyan riválisokat, mint a GPT-4o, a Mistral Large 2 és a Llama 3.
- A szöveges modellek több mint 200 nyelv támogatásával és akár 300 000 tokenes kontextusablakkal rendelkeznek — a tervek szerint ez 2025-ben 2 millió fölé bővül.
- Az Amazon Reel modellje hat másodperces videókat képes generálni szöveges vagy képi promptekből, és az előttünk álló hónapokban a hosszúság akár két percre is bővül.
- Az Amazon azt is elárulta, hogy 2025-ben beszéd-beszéd (speech-to-speech) és „bármiből-bármit” (any-to-any) modalitású modellekkel bővül a Nova kínálata.
Úgy tűnt, az Amazon később indult az AI-versenyben, de ez a kiadás a vállalat eddigi legnagyobb lépése. Hatalmas ügyfélbázisával, szinte korlátlan anyagi erőforrásaival és a mostani, rendkívül versenyképes modelljeivel a kiskereskedelmi óriás sötét lóként gyorsan felkapaszkodhat az AI ranglétra tetejére. ---