Lexi Bogan az OpenAI Voice Engine-t használja természetes hangja visszaállítására
Az OpenAI legújabb technológiai fejlesztése, a Voice Engine nevű hangklónozó platform, hatalmas reményt adhat azoknak, akik valamilyen egészségügyi okból elveszítették a beszédképességüket. Egy 22 éves amerikai lány, Lexi Bogan, a Rhode Island-i Lifespan kórházcsoport orvosainak segítségével egy kísérleti program keretében kapta vissza a saját, természetes hangját az AI segítségével. Miután egy daganat miatti intenzív műtét során megsérültek a hangszalagjai, a mesterséges intelligencia nyújtott számára megoldást az önkifejezésre, teljesen megváltoztatva az életét.
Lexi Bogan élete tavaly vett drámai fordulatot, amikor kiderült, hogy egy daganat alakult ki az agya közelében. A diagnózist követően egy rendkívül megterhelő, tíz órán át tartó műtéten esett át. Bár az operáció sikeres volt, a beavatkozás során súlyos és maradandó sérüléseket szenvedtek a hangszalagjai. A fiatal lány hirtelen azzal a megrázó valósággal szembesült, hogy már nem képes a korábbi módon használni a hangját. Lexi az Associated Press hírügynökségnek nyilatkozva úgy fogalmazott, hogy a trauma után olyan érzése volt, mintha az identitásának egy jelentős részét vették volna el tőle. Ekkor keresték meg őt a Lifespan kórház orvosai azzal a különleges lehetőséggel, hogy legyen a tesztalanya az OpenAI vadonatúj fejlesztésének.
A Voice Engine platform működési elve egészen lenyűgöző és hatékony. Ahhoz, hogy az AI modell tökéletesen elsajátítsa és megtanulja Bogan hangjának minden apró csínját-bínját, egyetlen rövid hanganyagra volt szükség. Az orvosok és a fejlesztők egy mindössze tizenöt másodperces klipet használtak fel egy olyan videóból, amelyet Lexi még a középiskolás évei alatt rögzített. Ennek a minimális mintának a segítségével a rendszer képes volt rekonstruálni a teljes hangkarakterét. Ma a technológia úgy működik a mindennapokban, hogy Bogan beírja a kívánt szöveget a telefonjába, a szoftver pedig azonnal, valós időben felolvassa azt a saját hangján. A Voice Engine ráadásul olyan finom részleteket is képes hűen reprodukálni, mint a nevetés vagy más érzelmi gesztusok, amelyeket a hagyományos rendszerekkel szinte lehetetlen lenne utánozni.
Ez a technológiai áttörés messze túlmutat az egyszerű kényelmen, komoly pszichológiai és társadalmi jelentőséggel bír. A beszédképességüket elvesztő betegek tapasztalatai szerint rendkívül nyomasztó és nehéz egy teljesen idegen ember hangját, vagy ami még rosszabb, egy rideg, robotikus hangot hallani a jelenleg elterjedt protézisek és elektrolarynx eszközök használata során. Az OpenAI mellett több tech startup és nagyvállalat is dolgozik hasonló hangklónozó megoldásokon, amelyek célja a betegek egyedi tónusának és hangszínének pontos visszaadása. Dr. Rohaid Ali, Bogan egyik kezelőorvosa kiemelte, hogy ez a technológia életre szóló társadalmi haszonnal bír a páciensek számára. Az orvos szerint az AI segítségével képesek visszaadni Lexinek az igazi, megszokott hangját, így a lány újra úgy beszélhet a környezetével, ahogyan az a leginkább önazonos és természetes a számára.
A beszédképességüket elvesztő betegek szerint nehéz más hangját — vagy ami még rosszabb, egy robotikus hangot — hallani a manapság elterjedt protézisek és elektrolarynx eszközök használata közben. Az OpenAI csak egy a számos cég közül, amelyek olyan hangklónozó technológián dolgoznak, amely pontosabban képes reprodukálni a betegek egyedi tónusát és hangszínét. Rohaid Ali, Bogan egyik orvosa elmondta, hogy a technológia életre szóló társadalmi haszonnal bírhat: „Képesek vagyunk visszaadni Lexinek az igazi hangját, és ő képes úgy beszélni, ahogy az a leginkább önazonos számára.” ---