MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra
A Google elindította a Gemini 3.5 Live Translate-et a valós idejű beszédhez

A Google elindította a Gemini 3.5 Live Translate-et a valós idejű beszédhez

A Google forradalmi lépésre szánta el magát a mesterséges intelligencia alapú kommunikáció terén, bemutatva a Gemini 3.5 Live Translate modellt. Ez az új, kifinomult speech-to-speech technológia arra képes, hogy valós időben ismerje fel és fordítsa le a beszédet több mint 70 különböző nyelven. A fejlesztés legfontosabb újítása, hogy a hagyományos fordítóeszközökkel ellentétben nem csupán a szavakat közvetíti, hanem megőrzi az eredeti beszélő egyedi hangszínét és beszédtempóját is. A rendszer rendkívül alacsony, csupán néhány másodperces késleltetéssel dolgozik, így folyamatos, természetes társalgást tesz lehetővé a résztvevők számára a teljes beszélgetés alatt.

A technológia jelentősége abban rejlik, hogy lebontja a nyelvi akadályokat a globális kommunikáció során, miközben fenntartja a személyes kapcsolat érzetét. A Gemini 3.5 Live Translate képességei már most is elérhetőek a felhasználók számára a Google Translate alkalmazásban, ahol az automatikus nyelvfelismerés révén könnyedén áthidalhatók a nyelvi nehézségek. A Google emellett gőzerővel dolgozik a szolgáltatás további integrációján is, hiszen jelenleg is zajlik a technológia bevezetése a Google Meet platformra. Ez a lépés különösen fontos a vállalati szféra és a nemzetközi együttműködések számára, mivel lehetővé teszi a valós idejű értekezlet-fordítást, így a különböző nyelvet beszélő munkatársak is akadálymentesen vehetnek részt közös megbeszéléseken.

Az, hogy a Google ilyen mértékben helyezi előtérbe az AI-alapú, valós idejű kommunikációs megoldásokat, egyértelműen jelzi az iparág irányát, ahol a hangsúly a puszta szöveges fordításról a természetes, emberi interakciót imitáló megoldásokra tevődik át. A Gemini 3.5 Live Translate nem csupán egy technikai bravúr, hanem egy olyan eszköz, amely képes megváltoztatni azt, ahogyan a világ különböző pontjain élő emberek együttműködnek egymással. A folyamatos fejlesztéseknek és a Google ökoszisztémájába történő mélyebb integrációnak köszönhetően a jövőben várhatóan még zökkenőmentesebbé válnak a többnyelvű konferenciahívások, és a nyelvi korlátok hamarosan a múlt ködébe veszhetnek az üzleti és magánéleti kommunikációban egyaránt.

Eredeti forrás megtekintése (angol) →
Kapcsolódó hírek
Az 500 millió dolláros éves bevételt is elérte a "vibe coding" startup, a Lovable
2 napja
A WorkClaw olyan AI munkatársakat indított, akik úgy állnak munkába, mint az új alkalmazottak
2 napja
Az OpenAI benyújtotta tőzsdére lépési kérelmét egy héttel riválisa, az Anthropic után
3 napja
Tudj meg többet
Gemini a Gmail-ben és a Google Docs-ban: Így automatizáld a munkád
Gemini AI: A Google mesterséges intelligenciája közérthetően