AI KUTATÁS
Új AI fejhallgató, amely több beszélőt fordít egyszerre a 3D térben
A Washingtoni Egyetem kutatói egy olyan AI-vezérelt fejhallgató-rendszert fejlesztettek ki, amely képes több beszélőt egyszerre fordítani, miközben megőrzi a térbeli elhelyezkedést és az egyedi hangkarakterisztikákat.
- A „Spatial Speech Translation” rendszer kereskedelmi forgalomban kapható zajszűrős fejhallgatókat használ, amelyeket extra mikrofonokkal szereltek fel a környező beszélgetések rögzítésére.
- Az AI algoritmusok ezután szétválasztják az egyes beszélőket, valós időben lefordítják a beszédet, és visszajátsszák azt – megőrizve mind a hangszínt, mind a térbeli irányt.
- Az eszköz 360 fokban pásztáz, mint egy radar, hogy érzékelje és kövesse a több beszélőt, még akkor is, ha az alanyok vagy a viselő elmozdulnak.
- A technológia jelenleg spanyol, német és francia nyelven működik 2-4 másodperces késleltetéssel, és helyileg is futtatható Apple M2 chippel rendelkező eszközökön.
Miért fontos?
A fordítóalkalmazások rengeteget fejlődtek az AI-korszakban, de még mindig gyakran küzdenek a valós élet zajos és nyüzsgő helyzeteivel. Ez a térbeli megközelítés gyakorlati szempontból sorsfordító lehet – és ha integrálják az olyan mindennapi eszközökbe, mint az AirPods, az alapjaiban változtathatja meg a nyelvi korlátokon átívelő kommunikációt. ---