Hogyan használnak az AI ügynökök parancssori eszközöket (CLI-ket)
Az ügynökök LLM-ek eszközhasználattal. Nem csak válaszolnak neked, hanem dolgokat is megtehetnek helyetted. De mit is jelent valójában az „eszközhasználat”? Milyen eszközöket? A leggyakoribb eszközök CLI formájában léteznek. Az ügynökök szövegesen kommunikálnak, a CLI-k szöveges bemenetet/kimenetet használnak, így természetes illeszkedést jelentenek. A CLI egy szövegalapú módszer a szoftver vezérlésére. Begépelsz egy parancsot, valami történik. Íme egy egyszerű példa – fájlok rendezése, a bash eszköz használatával. 'Nevezze át mind a 400 termékfotót, hogy megfeleljen az SKU formátumunknak, méretezze át őket 1200x1200-ra, és rendezze kategóriák szerint mappákba.' Először az ügynök listázza a fájlokat, hogy megértse, mivel dolgozik. Ezután létrehozza a mappa struktúrát. Majd átméretezi a képeket. Aztán átnevezi és rendezi az egyes fájlokat. Ezután ellenőrzi az eredményt, mielőtt visszaküldi neked. Mindezeket másodpercek alatt megteszi. Neked manuálisan pár órába telne. Ez egy CLI, amit bash-nek hívnak, az általános célú command line, ami a számítógépeddel együtt jár. De vannak célra épített CLI-k is specifikus feladatokhoz: Stripe CLI – bevételi adatok lekérdezése, előfizetések kezelése, fizetések tesztelése; Playwright – webböngésző vezérlése: navigálás, kattintás, űrlapok kitöltése, screenshotok készítése; AWS CLI – szerverek indítása, adatbázisok kezelése, infrastruktúra skálázása; Vercel CLI – weboldal élő telepítése egyetlen paranccsal. Mindezek különálló eszközök, amelyeket egy ügynök használhat. A fájlrendezési példa egy eszközt (bash) használt. De adj egy ügynöknek Stripe CLI-t is, és most már lekérdezheti a bevételi számaidat. Add hozzá a Playwright-ot, és böngészhet a weben. Add hozzá a Vercelt, és telepítheti, amit épít. Mindez kicsit technikusan hangzik, és az is, de ezeket a nyers parancsokat csak akkor látnád, ha terminált használnál, vagy figyelnéd, ahogy elrepülnek az olyan eszközökben, mint a Claude Code. Jelen vannak, még akkor is, ha nem látod őket. Ha egy ügynök, mint a Cowork, feladatot végez, rákattinthatsz, hogy kibővítsd, amit futtatott, és lásd a részleteket – mint ez a példa, amely fájlokat listáz a legutóbbi alapfrissítések megtalálásához. Minden ügynök ilyen parancsokat futtat a háttérben. Az interfész csak elrejti és absztrahálja őket.
- Fájlok listázása a munkakönyvtár megértéséhez: `ls ./product-photos/`
- Strukturált mappa rendszer létrehozása: `mkdir -p ./output/{shoes,bags,jackets,hats}`
- Képek átméretezése: `mogrify -resize 1200x1200 ./product-photos/*.jpg`
- Egyedi fájlok átnevezése és rendezése (példa): `mv IMG_0291.jpg ./output/shoes/SKU-1042-BLK.jpg`
- Műveletek eredményének ellenőrzése: `ls -R ./output/ | head -20`
- Stripe CLI: Bevételi adatok lekérdezésére, előfizetések kezelésére és fizetések tesztelésére használatos.
- Playwright: Webböngésző vezérlésére, navigálásra, kattintásra, űrlapok kitöltésére és screenshotok készítésére használatos.
- AWS CLI: Szerverek indítására, adatbázisok kezelésére és infrastruktúra skálázására használatos.
- Vercel CLI: Weboldal élő telepítésére használatos egyetlen paranccsal.
Miért fontos?
Ezt jelenti az „eszközhasználat”. Minél több CLI-hez adsz hozzáférést egy ügynöknek, annál többet tud tenni. A te feladatod az, hogy biztosítsd, hogy a feladathoz megfelelőek legyenek. ---