MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az AI videó- és audiótechnológia eléri a fősodorbeli használhatóságot 2024-ben

Címsor: Az AI videó- és audiótechnológia eléri a fősodorbeli használhatóságot 2024-ben

Az AI videó- és audiótechnológia elképesztő fejlődési pályát járt be az utóbbi időben, és 2024-re végérvényesen elérte a fősodorbeli használhatóságot a mindennapokban. Ha felidézzük a közelmúltat, jól látható, mekkora utat tett meg ez a terület: alig két évvel ezelőtt a legfejlettebb AI-modellek még azzal is komoly küzdelmet folytattak, hogy egyetlen statikus, teljesen valósághű képet hozzanak létre. Ezzel szemben, gyorsan előreugorva 2024-be azt tapasztalhatjuk, hogy a modern AI-modellek most már arra is képesek, hogy akár másodpercek alatt kiváló minőségű videókat és komplex hangokat generáljanak a semmiből.

A mozgóképes szektorban az OpenAI indította el a hullámot ebben az évben, amikor hivatalosan is előrukkolt a Sora nevű modelljével. A Sora bemutatkozása valóságos áttörést jelentett, mivel a felhasználók egyszerű, szöveges leírások, úgynevezett promptok segítségével készíthetnek vele megdöbbentően élethű text-to-video generálásokat. A piaci verseny azonban rendkívül éles, így az Alphabet válasza sem váratott magára sokáig. Nem sokkal később megérkezett a Google Veo-2 terméke, amely a tesztek alapján úgy tűnt, hogy bizonyos területeken le is győzte a rivális Sora modellt. A Veo-2 ugyanis bevezette a kristálytiszta 4K felbontást, miközben sokkal természetesebb mozgóképes mozgást biztosított a generált felvételeken.

Ezzel egy időben a hangalapú technológiák terén is radikális változások zajlottak le. Két meghatározó fejlesztés, az ElevenLabs és a NotebookLM végérvényesen felteszik az AI-audiót a térképre a szélesebb közönség körében is. Az általuk kínált innovatív alkalmazások, mint például a rendkívül valósághű hanggenerálás, új szintre emelték a technológiát. Különösen népszerűvé váltak az AI-generált podcastok, amelyeket a hallgatók és a felhasználók kifejezetten imádnak az élvezhető és természetes megszólalások miatt.

Mindezen fejlemények fényében egyértelművé válik, miért is számít ez kiemelkedően fontos mérföldkőnek a technológiai világban. Az AI videó és audió technológiája ugyanis hosszú kísérletezés után végre valóban gyakorlatiasan használhatóvá vált a nagyközönség számára. Ez a fősodorbeli áttörés lehetővé teszi, hogy bárki teljesen valósághű és professzionális minőségű tartalomgenerálást hajtson végre mindössze néhány másodperc leforgása alatt, lebontva a korábbi technikai és időbeli korlátokat.

Miért fontos?

Az AI videó és audió végre használhatóvá vált, lehetővé téve a valósághű tartalomgenerálást másodpercek alatt. ---

Eredeti forrás megtekintése (angol) →
Kapcsolódó hírek
Az open-source modellek bezárják a teljesítménybeli szakadékot a zárt rendszerekkel szemben
6 napja
Elon Musk xAI-ja gyorsan jelentős AI-hatalommá válik
6 napja
Az AI dominálja a professzionális munkafolyamatokat a kódolásban és a digitális marketingben
6 napja