A Vellum ügynöki viselkedés keretrendszerének hat szintje
Találtam egy új keretrendszert, amely tisztázza az AI ügynökök kusza világát egy 6 szintű autonómia hierarchiával.
Míg az AI ügynökök legtöbb definíciója bináris (vagy az, vagy nem az), a Vellum új keretrendszere az ügynökség spektrumát vezeti be, ami sokkal értelmesebb a jelenlegi AI tájkép szempontjából.
Az ügynöki viselkedés hat szintje világos utat mutat az alapvetőtől a haladóig.
- 𝐋𝐞𝐯𝐞𝐥 0 - 𝐒𝐳𝐚𝐛á𝐥𝐲𝐚𝐥𝐚𝐩ú 𝐌𝐮𝐧𝐤𝐚𝐟𝐨𝐥𝐲𝐚𝐦𝐚𝐭 (𝐅𝐨𝐥𝐥𝐨𝐰𝐞𝐫): Nincs intelligencia – csak ha-ez-akkor-az logika döntéshozatal vagy adaptáció nélkül. Példák: Zapier munkafolyamatok, pipeline ütemezők és szkriptelt botok – hasznos, de merev rendszerek, amelyek felmondják a szolgálatot, ha a körülmények megváltoznak.
- 𝐋𝐞𝐯𝐞𝐥 1 - 𝐀𝐥𝐚𝐩 𝐕á𝐥𝐚𝐬𝐳𝐨𝐥ó (𝐄𝐱𝐞𝐜𝐮𝐭𝐨𝐫): Minimális autonómiát mutat – bemenetek feldolgozása, adatok lekérése és válaszok generálása minták alapján. A fő korlát: nincs vezérlőhurok, memória vagy iteratív gondolkodás. Tisztán reaktív, mint a ChatGPT vagy Claude alap implementációi.
- 𝐋𝐞𝐯𝐞𝐥 2 - 𝐄𝐬𝐳𝐤ö𝐳ö𝐤 𝐇𝐚𝐬𝐳𝐧á𝐥𝐚𝐭𝐚 (𝐀𝐜𝐭𝐨𝐫): Nem csak válaszol, hanem végrehajt – képes külső eszközök meghívására, adatok lekérésére és az eredmények beépítésére. Itt él a legtöbb jelenlegi AI alkalmazás, beleértve a ChatGPT-t beépülő modulokkal vagy a Claude-ot Function Calling-gal. Még mindig alapvetően reaktív, önkorrekció nélkül.
- 𝐋𝐞𝐯𝐞𝐥 3 - 𝐌𝐞𝐠𝐟𝐢𝐠𝐲𝐞𝐥, 𝐓𝐞𝐫𝐯𝐞𝐳, 𝐂𝐬𝐞𝐥𝐞𝐤𝐬𝐳𝐢𝐤 (𝐎𝐩𝐞𝐫𝐚𝐭𝐨𝐫): Kezeli a végrehajtást lépések leképezésével, kimenetek értékelésével és beállításokkal, mielőtt továbblépne. Ezek a rendszerek állapotváltozásokat észlelnek, többlépéses munkafolyamatokat terveznek és belső értékeléseket futtatnak. Olyan példák, mint az AutoGPT vagy a LangChain ügynökök, megkísérlik ezt, bár a feladat befejezése után leállnak.
- 𝐋𝐞𝐯𝐞𝐥 4 - 𝐓𝐞𝐥𝐣𝐞𝐬𝐞𝐧 𝐀𝐮𝐭𝐨𝐧ó𝐦 (𝐄𝐱𝐩𝐥𝐨𝐫𝐞𝐫): Állapotfüggő rendszerekként viselkedik, amelyek fenntartják az állapotot, autonóm módon indítanak műveleteket és valós időben finomítják a végrehajtást. Ezek az ügynökök több adatfolyamot "figyelnek" és állandó emberi beavatkozás nélkül hajtanak végre. A Cognition Labs Devin-je és az Anthropic Claude Code-ja erre a szintre aspirál, de még korai szakaszban járunk, a megbízható perzisztencia a kulcskérdés.
- 𝐋𝐞𝐯𝐞𝐥 5 - 𝐓𝐞𝐥𝐣𝐞𝐬𝐞𝐧 𝐊𝐫𝐞𝐚𝐭í𝐯 (𝐈𝐧𝐯𝐞𝐧𝐭𝐨𝐫): Létrehozza saját logikáját, eszközöket épít menet közben és dinamikusan komponálja a funkciókat új problémák megoldására. Még sehol nem tartunk itt – még a legerősebb modellek (o1, o3, Deepseek R1) is túlillesztik és beégetett heurisztikákat követnek ahelyett, hogy valódi kreativitást mutatnának.
Miért fontos?
A keretrendszer megmutatja, hol tartunk most: termelési szintű megoldások a 2. szintig, a legtöbb innováció a 2-3. szinten zajlik. Ez a taxonómia segít a fejlesztőknek megérteni, milyen típusú ügynököt hoznak létre, és milyen képességek felelnek meg az egyes szinteknek. ---