Új AI-eszközök mélyreható kutatáshoz, ágens-sandboxokhoz és videókhoz
Az utóbbi időben a mesterséges intelligencia piaca látványos fordulóponthoz érkezett, ahol a hangsúly az egyszerű chatbotokkal folytatott párbeszédekről a komplex, önálló munkavégzésre képes rendszerek felé tolódott el. Az új generációs eszközök már nem csupán rövid szövegeket generálnak, hanem mélyreható kutatásokat végeznek, operációs rendszerekben navigálnak, és teljes videós produkciókat menedzselnek. Ez a fejlődési irány azt mutatja, hogy az AI egyre mélyebben integrálódik a professzionális munkafolyamatokba, és képes átvállalni azokat az időigényes, strukturált feladatokat, amelyek korábban kizárólag emberi beavatkozást igényeltek.
A Perplexity Deep Research az egyik legizgalmasabb újdonság ezen a téren, amely a keresőmotorok és a tudományos kutatómunka jövőjét vetíti előre. Ez a funkció lehetővé teszi a felhasználók számára, hogy ne csak egyszerű kérdéseket tegyenek fel, hanem hosszú távú kutatási projekteket indítsanak el egy dedikált munkaterületen belül. A rendszer képes komplex adatokat elemezni, és azokból részletes szakmai jelentéseket, prezentációkat vagy interaktív műszerfalakat készíteni. Ezzel párhuzamosan a Use Computer nevű megoldás az AI-ágensek számára nyit új kapukat azáltal, hogy biztonságos sandbox-környezeteket biztosít Mac, iPhone és Ubuntu rendszereken. Ebben a környezetben az ágensek valódi operációs rendszereken hajthatnak végre feladatokat, például kattinthatnak, gépelhetnek vagy rögzíthetik a munkafolyamatokat. Ehhez a technológiai vonalhoz illeszkedik a Pool is, amely a vizuális adatgyűjtést forradalmasítja: rendszerezi a képernyőmentéseket és képes visszaállítani az eredeti forráslinkeket, így teremtve kereshető, strukturált tudásbázist a szétszórt információkból.
A kreatív szektor és a tartalomgyártás szintén jelentős szintlépésen megy keresztül az automatizáció révén. Az ElevenLabs bemutatta az Avatars funkciót, amely a hanggenerálás után most a vizuális megjelenítésben is konzisztenciát ígér. A felhasználók forgatókönyvek alapján hozhatnak létre élethű, beszélő karaktereket, ami alapjaiban változtathatja meg a digitális oktatást és a vállalati kommunikációt. Ezt az ökoszisztémát egészíti ki az OpenCreator, amely a videógyártás teljes spektrumát lefedi. Egyetlen közös munkaterületen belül automatizálja a forgatókönyvírást, a castingot és a vágást, drasztikusan csökkentve a produkciós időt.
Ezek az új fejlesztések együttesen jelzik, hogy az AI-fejlesztések kora a passzív segítségnyújtásból az aktív, végrehajtó jellegű ágensek korszakába lépett át. A startupok már nem csak modelleket, hanem komplett ökoszisztémákat építenek, ahol a mesterséges intelligencia képes átlátni és koordinálni a többlépcsős folyamatokat is. Ez a váltás különösen fontos a vállalatok számára, hiszen a hatékonyság növelése mellett lehetővé teszi, hogy az emberi munkaerő a stratégiai döntésekre és a valódi kreativitásra fókuszálhasson, miközben az AI elvégzi a technikai kivitelezést.
- Perplexity Deep Research: Jelentéseket és prezentációkat készít hosszú távú kutatási munkaterületek használatával.
- Use Computer: Valódi operációs rendszer sandboxokat biztosít ágensek számára kattintáshoz, gépeléshez és munkafolyamatok rögzítéséhez.
- Pool: Rendszerezi a képernyőmentéseket és visszaállítja az eredeti linkeket a kereshető gyűjteményekhez.
- ElevenLabs Avatars: Konzisztens beszélő videókat generál forgatókönyvekből.
- OpenCreator: Automatizálja a forgatókönyvírást, a castingot és a vágást egyetlen munkaterületen.