Az Adobe bemutatta AI-alapú hanggeneráló rendszerét
Az Adobe kutatócsoportja bemutatta legújabb fejlesztését, a MultiFoley névre keresztelt AI-rendszert, amely alapjaiban alakíthatja át a videós utómunka folyamatait. Ez a technológia képes arra, hogy automatikusan generáljon precízen szinkronizált hanghatásokat mozgóképekhez, mindezt szöveges utasítások, referenciahangok vagy már meglévő hangminták alapján. A fejlesztés célja, hogy a professzionális videógyártás egyik legidőigényesebb részét, a zörejhangok és környezeti effektek létrehozását és időzítését egyszerűbbé, gyorsabbá és mindenki számára hozzáférhetővé tegye, anélkül, hogy a minőség csorbát szenvedne.
A technikai részleteket tekintve a MultiFoley lenyűgöző teljesítményre képes, hiszen 48kHz-es mintavételezésű, kiváló minőségű hanganyagot produkál. A rendszer egyik legnagyobb fegyverténye a rendkívüli pontosság: a generált hangok és a képernyőn látható akciók közötti szinkronizációs eltérés mindössze 0,8 másodperc körül alakul, ami emberi füllel érzékelve tökéletes illeszkedést biztosít. A fejlesztők a tanítási folyamathoz internetes videók és professzionális hangeffekt-könyvtárak hatalmas adathalmazát használták fel, így az algoritmus nemcsak a hangokat tanulta meg, hanem azt is, hogyan kapcsolódnak azok a vizuális ingerekhez. Ennek köszönhetően a felhasználók akár kreatív módosításokat is végezhetnek, például egy házi macska hétköznapi nyávogását félelmetes oroszlánüvöltéssé alakíthatják át úgy, hogy a hang dinamikája és időzítése továbbra is tökéletesen követi a macska szájmozgását a videóban.
A MultiFoley jelentős előrelépést mutat a korábbi hasonló kísérletekhez képest. A fejlesztők által lefolytatott felhasználói tanulmányok szerint a rendszer jelentősen magasabb pontszámokat kapott a tesztelők körében a különböző kategóriákban, mint a korábbi hasonló modellek. Ez a kiemelkedő pontosság és rugalmasság különösen fontossá teszi az eszközt a professzionális tartalomgyártók számára. Míg korábban a zörejművészeknek, azaz a Foley artist-oknak fizikai tárgyak és különleges technikák segítségével kellett manuálisan rögzíteniük minden egyes lépést vagy ajtónyikorgást, addig az Adobe új megoldása ezt a folyamatot a digitális térbe emeli. Az AI-alapú hangtervezés kora ezzel véglegesen megérkezett a stúdiókba.
Miért is annyira fontos ez a mérföldkő? A videógyártás világa eddig elképzelhetetlen volt a zörejművészek kreatív, de gyakran sziszifuszi munkája nélkül, akik különös tárgyak megszólaltatásával keltették életre a filmek hangvilágát. A MultiFoley-val azonban az egyedi és szinkronizált hangsávok létrehozása hamarosan olyan egyszerű feladattá válik, mint egy chatbottal való gépelés. Ez a váltás teljesen új távlatokat nyit a kreatív munkafolyamatokban, hiszen a független alkotók és a kisebb produkciók is hozzáférhetnek olyan szintű hangutómunkához, amely korábban csak a legnagyobb hollywoodi stúdiók számára volt elérhető. Az Adobe technológiája tehát nem csupán egy újabb szoftveres eszköz, hanem a demokratizált hangtervezés felé tett hatalmas lépés.
- A rendszer kiváló minőségű, 48kHz-es hangot produkál, amely pontosan szinkronizál a képernyőn látható akcióval, mindössze 0,8 másodperces szinkronizálási pontosságot elérve.
- A MultiFoley-t internetes videók és professzionális hangeffekt-könyvtárak kombinált adatkészletén tanították, hogy lehetővé tegyék a teljes sávszélességű hanggenerálást.
- A felhasználók kreatívan alakíthatják át a hangokat — például egy macska nyávogását oroszlánüvöltéssé —, miközben a videóval való időzítés továbbra is megmarad.
- A MultiFoley magasabb szinkronizálási pontosságot ér el, mint a korábbi modellek, és egy felhasználói tanulmányban jelentősen magasabb értékelést kapott a különböző kategóriákban.
Bár a különféle tárgyakat egyedi hangok létrehozásához használó zörejművészek (Foley artist-ok) különös videói a videógyártás vadregényes részét képezik, az AI ideje elérkezett a professzionális hangtervezésben. Az egyedi, szinkronizált hangsávok és effektek létrehozása hamarosan olyan egyszerű lesz, mint egy chatbottal való gépelés — ami teljesen új lehetőségeket nyit meg a kreatív munkafolyamatok előtt. ---