MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra
Az Amazon az új Nova audio- és videomodellekkel csökkenti a lemaradását

Az Amazon az új Nova audio- és videomodellekkel csökkenti a lemaradását

Az Amazon komoly lépést tett az AI-versenyben az új Nova audio- és videomodelljeinek bemutatásával, amellyel jelentősen csökkenti a korábbi lemaradását a piacvezető riválisaival szemben. Bár sokan hajlamosak voltak már teljesen leírni az e-kereskedelmi óriást ezen a tech területen, a legfrissebb fejlesztések egyértelműen bizonyítják, hogy mindenkinek érdemes újragondolnia a piaci helyzetet. A frissen bejelentett Nova Reel és Nova Sonic modellek a multimodális mesterséges intelligencia új generációját képviselik, és olyan technológiai megoldásokat hoznak, amelyek közvetlen kihívást jelentenek a legnagyobb konkurensek számára.

A videógenerálás terén a Nova Reel nevű videomodell kapott egy kifejezetten jelentős frissítést, amely mostantól lehetővé teszi akár kétperces, több különálló jelenetből és snittből álló videók generálását. A modell egyik legnagyobb technológiai fegyvere, hogy képes konzisztens karaktereket és vizuális stílusokat biztosítani a teljes folyamat során. Ez a fajta vizuális konzisztencia pontosan az a kritikus terület, amellyel a legtöbb jelenlegi VLM még mindig komoly kihívásokkal és nehézségekkel küzd, így az Amazon technológiája hatalmas előrelépést jelenthet.

A vizuális tartalmak mellett a hangalapú technológia is óriásit lépett előre a Nova Sonic nevű új audiomodell bevezetésével. Az Amazon hivatalos állítása szerint ez a megoldás teljes mértékben felveszi a versenyt az OpenAI legújabb fejlett hangalapú megoldásaival, miközben rendkívül költséghatékony alternatívát kínál, hiszen akár 80%-kal olcsóbb a versenytársak ajánlatainál. A Nova Sonic valamivel alacsonyabb késleltetéssel (latency) rendelkezik, mint a GPT-4o modell, és lényegesen jobban értelmezi a mormogást vagy a nehezen érthető beszédet is. Ráadásul a felhasználói élményt jelentősen javítja, hogy a rendszer nem szakítja félbe a felhasználót a mondat közepén. Az új technológia ráadásul már a gyakorlatban is bizonyít, hiszen az Alexa+ már aktívan használja az új Nova Sonic modellt.

Mindkét modell piaci bemutatása rendkívül fontos mérföldkövet jelent. Ezek a fejlesztések egyértelműen azt mutatják, hogy az Amazon a legnagyobb riválisai mögötti többéves lemaradás után most rendkívül gyors tempóban zárkózik fel a multimodális AI területén. Az új modellek kiváló technikai paraméterei és a rendkívül kedvező árazás alapjaiban változtathatják meg az erőviszonyokat a mesterséges intelligencia piacán.

Miért fontos?

Mindkét modell azt mutatja, hogy az Amazon a legnagyobb riválisai mögötti többéves lemaradás után gyorsan felzárkózik a multimodális AI területén. ---

Eredeti forrás megtekintése (angol) →
Kapcsolódó hírek
Az Apple megerősítette, hogy a Google Gemini-t használja a Sirihez és a helyi modellek tanításához
most
Az AI-t használó jelöltek tönkreteszik a hagyományos szoftverfejlesztői állásinterjúkat
most
Az ElevenLabs új szinkronizáló modellje nyelveken átívelő érzelmi átvitelre képes
2 napja