Új AI fejhallgató, amely több beszélőt fordít egyszerre a 3D térben

2025. május 20. · MI Történik? · 1 perc olvasás

A Washingtoni Egyetem kutatói egy olyan AI-vezérelt fejhallgató-rendszert fejlesztettek ki, amely képes több beszélőt egyszerre fordítani, miközben megőrzi a térbeli elhelyezkedést és az egyedi hangkarakterisztikákat.

A „Spatial Speech Translation” rendszer kereskedelmi forgalomban kapható zajszűrős fejhallgatókat használ, amelyeket extra mikrofonokkal szereltek fel a környező beszélgetések rögzítésére.
Az AI algoritmusok ezután szétválasztják az egyes beszélőket, valós időben lefordítják a beszédet, és visszajátsszák azt – megőrizve mind a hangszínt, mind a térbeli irányt.
Az eszköz 360 fokban pásztáz, mint egy radar, hogy érzékelje és kövesse a több beszélőt, még akkor is, ha az alanyok vagy a viselő elmozdulnak.
A technológia jelenleg spanyol, német és francia nyelven működik 2-4 másodperces késleltetéssel, és helyileg is futtatható Apple M2 chippel rendelkező eszközökön.

Miért fontos?

A fordítóalkalmazások rengeteget fejlődtek az AI-korszakban, de még mindig gyakran küzdenek a valós élet zajos és nyüzsgő helyzeteivel. Ez a térbeli megközelítés gyakorlati szempontból sorsfordító lehet – és ha integrálják az olyan mindennapi eszközökbe, mint az AirPods, az alapjaiban változtathatja meg a nyelvi korlátokon átívelő kommunikációt. ---

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

A Perplexity és a Harvard tanulmánya feltérképezi az összetett AI ágens alapú munka felé való eltolódást

4 napja

Az MIT tanulmánya azonosítja a legfőbb AI-kockázatokat és a felelős intézményeket

5 napja

Tanulmány: Az AI tutorok felülmúlják a jogi kart

2026. június 4.

Tudj meg többet

AI a kutatásban és oktatásban: Hatékony irodalomkutatás és forráselemzés

AI fordítás és szövegjavítás: Így írj profin idegen nyelveken