MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Saját kommunikációs protokollt kaptak az AI-ágensek

Forradalmi áttörést hozhat a mesterséges intelligencia alapú ágensek közötti kommunikációban egy új fejlesztés, amely lehetővé teszi, hogy a szoftverek közvetlenül egymással beszélgessenek, teljesen megkerülve az emberi beszéd generálásának szükségességét. Két fejlesztő bemutatta a Gibber Link névre keresztelt hangalapú kommunikációs protokollt, amely képes felismerni, ha a telefonhívás másik végén is egy AI-ágens tartózkodik. Amint ez a felismerés megtörténik, a rendszer a hagyományos emberi beszédről azonnal egy közvetlen, gép-gép közötti adatátviteli módra vált. Ez a technológia drasztikusan, akár 90 százalékkal képes csökkenteni a számítási költségeket, miközben a kommunikációs időt is radikálisan, mintegy 80 százalékkal lerövidíti, új távlatokat nyitva az automatizált rendszerek világában.

A projekt Anton Pidkuiko és Boris Starkov nevéhez fűződik, akik az ElevenLabs legutóbbi Hackathonján alkották meg ezt a rendkívüli rendszert. A Gibber Link működésének alapját egy ggwave nevű open-source hangalapú adatátviteli könyvtár biztosítja. A fejlesztők által prezentált működő demóban jól látható, amint a telefonáló ágens azonosítja a túloldalon lévő másik mesterséges intelligenciát, és a normál emberi hangot azonnal felváltják a régi betárcsázós modemek stílusára emlékeztető ggwave audiojelek, miközben a folyamatot valós idejű szöveges transzkripciók kísérik. Ez a hangszintű protokoll kiválóan küszöböli ki a bonyolult és erőforrás-igényes beszédgenerálást. Ráadásul a speciális kialakításának köszönhetően a rendszer még a kifejezetten zajos környezetben is sokkal tisztább és megbízhatóbb kommunikációt biztosít a hagyományos, beszédmód-felismerésen alapuló rendszerekkel összehasonlítva.

Ez a hackathon-győztes projekt rávilágít egy rendkívül fontos jövőbeli trendre: az AI hangalapú ágensek hamarosan a mindennapjaink szerves részévé válnak, ami azt jelenti, hogy az AI-AI közötti hívások volumene a közeljövőben exponenciális növekedésnek indul. Ez a jelenség különösen az üzleti szférában lesz szembetűnő, ahol a vállalati folyamatokat egyre nagyobb részben automatizált asszisztensek végzik majd. Ha a robotok egymás között is az emberek számára optimalizált lassú beszédet használnák, az hatalmas és felesleges pazarlást jelentene mind időben, mind a drága GPU erőforrások terén. A Gibber Link tökéletes példa arra, hogy a hatékonyabb és költségkímélőbb digitális megoldások hogyan nyithatnak teljesen új utakat az AI-kommunikációban, optimalizálva a jövő technológiai infrastruktúráját.

Miért fontos?

Az AI hangalapú ágensek hamarosan mindenhol ott lesznek, ami azt jelenti, hogy az AI-AI hívások volumene exponenciálisan nőni fog (különösen az üzleti szférában). Ez a hackathon-győztes projekt remek példa arra, hogyan nyithatnak teljesen új utakat az AI-kommunikációban a hatékonyabb és költségkímélőbb módszerek. ---

Eredeti forrás megtekintése (angol) →
Kapcsolódó hírek
NYT-újságíró AI segítségével, ingatlanügynök nélkül adta el házát
most
Az Anthropic megerősítette, hogy a nagyteljesítményű Mythos modell hamarosan elérhető lesz a nyilvánosság számára
most
Az ElevenLabs Music v2 lehetővé teszi a szám közbeni műfajváltást és a gyors repet
most
Tudj meg többet
Helyi AI futtatása saját gépen: Útmutató az Ollama és LM Studio használatához
Saját AI asszisztens készítése: Útmutató a Custom GPTs és Claude Projects használatához