Devin: Egy teljesen autonóm felhőalapú kódoló ügynök
A beállítás percekig tartott: bejelentkezés, GitHub csatlakoztatása, és Devin már készen is állt. Átvizsgálta a kódbázist, magabiztos tervet készített, végrehajtotta a feladatot, és egy jól strukturált pull requestet nyitott meg, mindezt autonóm módon. Az élmény olyan volt, mintha egy szenior mérnökkel páros programoznék: látható a shell (a parancssor a kód futtatásához), a VS Code (ahol a kódot szerkesztik), és egy böngésző (a teszteléshez), mindez valós időben frissülve. A pull request tartalmazott egy világos összefoglalót, teszttervet, sőt még egy diagramot is, megkönnyítve az áttekintést. Devin közvetlenül a GitHubon keresztül kezelte a visszajelzéseket, akárcsak egy igazi csapattárs. Olyan érzés volt együttműködni valakivel, aki nemcsak minőségi kódot szállít, hanem azt is tudja, hogyan kell beolvasztani.
Devin természetesen illeszkedik a csapatmunkafolyamatokba. A GitHubon áttekintheti a kódját, vagy kérdéseket tehet fel neki, pontosan úgy, mint egy kollégájának. Integrálódik a Slack-kel, Linearral és Jirával is, lehetővé téve, hogy megjelölje egy szálban, vagy hozzárendelje egy feladathoz. Devin képes csatlakozni MCP szerverekhez is, zökkenőmentes kapcsolatot biztosítva külső eszközökkel és belső rendszerekkel. MCP szerverén keresztül Devin strukturált kontextust tud lehúzni dokumentációból, analitikából és monitoring platformokból, mint a Notion, Sentry és Datadog. Ez megkönnyíti Devin számára, hogy mélyebb tudatossággal működjön az infrastruktúráról és az üzleti logikáról.
Devin teljesen autonóm: miután feladatot rendel hozzá, további bemenet nélkül elkészít egy pull requestet. Webes alkalmazásokhoz akár maga is futtathatja és tesztelheti az alkalmazást. Ez az autonómia azért erőteljes, mert lehetővé teszi több kódoló ügynök felügyelet nélküli futtatását. A hátránya, hogy letérhet a helyes útról, ha a prompt és a szándékai homályosak, időt és tokeneket pazarolva. Szerencsére Devin jelentősen javult azóta, hogy legutóbb decemberben teszteltem, így autonómmá és hasznossá vált.
Devin árképzése Agent Compute Unit-okban (ACU) van strukturálva. Ezek az egységek képviselik Devin által egy munkamenetben végzett munkát. Az olyan lépések, mint a tervezés, kontextusgyűjtés, kód futtatása vagy böngésző használata, mind ACU-kat fogyasztanak. Egy ACU 2,25 dollárba kerül. A benchmark feladatom 3 ACU-t használt, ami körülbelül 6,75 dollárra jön ki. Ez egy egyszerű munkához képest sok. Ez az új ACU modell súrlódást is okoz. Mivel más kódoló ügynök nem használja, nincs mentális benchmark, ami megnehezíti a fejlesztők számára a költségek becslését. Az átláthatóság hiánya habozást okoz, ami akadályozza az elfogadást, különösen, amikor az egyszerűbb árképzési modellek a normák.
- Prompt javító gomb
- Devin tudásának kihasználása
- Devin Playbookok, Claude Subagensek mintájára
- Devin csatlakoztatása Slack-hez/Linear-hoz/Jira-hoz