MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az AssemblyAI elindította valós idejű, streaming Speech-To-Text API-ját nagy pontossággal

Az AssemblyAI már egy ideje a partnerünk, és most megérkezett a legújabb Streaming Speech-To-Text API-juk. Gondoljunk a streamingre úgy, mint amikor felteszünk egy kérdést a ChatGPT-nek vagy a Claude-nak, és a kimenet soronként kezd megjelenni. Ez sokkal kellemesebb élmény, mint a teljes válaszra várni. A hangalapú eszközöknél a streaming nehéz, mert a következő néhány szó megváltoztathatja annak az értelmezését, amit már elmondtunk. Az AssemblyAI API-ja most ezt egyensúlyozza ki elképesztő sebességgel, költséghatékonysággal és pontossággal. Így olyan élményt építhetünk, amely egyesíti a felhasználók beszédét és az általuk látott átiratot, anélkül, hogy az akadozna. Leteszteltem, írtam róla egy rövid véleményt, és szerintem érdemes megnéznetek, ha bármit építetek hanggal, vagy hangalapú képességeket szeretnétek hozzáadni az alkalmazásaitokhoz vagy munkafolyamataitokhoz. Én is hozzá fogom adni több saját projektemhez, ahol szeretem látni, amit mondok – amit a jelenlegi hangalapú eszközeim nem tudnak!
Miért fontos?

A késleltetés és a pontosság a legnagyobb akadályok a hangalapú AI-ban; a streaming átírás természetesebb, gördülékenyebb élményt tesz lehetővé, ahol a felhasználók valós időben ellenőrizhetik az AI értelmezését. ---

Eredeti forrás megtekintése (angol) →