A NAP AI TUDÁSANYAGA
A kódoló AI ügynök 13 napig működik folyamatosan önellenőrzéssel
A legtöbb AI kódoló ügynök egy óra után elveszti a fonalat. Simon Last, a Notion társalapítója most közzétett egy receptet, amellyel egy ilyen ügynök 13 napig folyamatosan működtethető, és ennek semmi köze a bonyolult promptokhoz. Minden arról szól, hogy megadjuk az ügynöknek, amire szüksége van a saját munkája ellenőrzéséhez.
- Önellenőrzés: Tervezz tesztrétegeket, amelyeken az ügynök ciklusokat futtathat. Magának kell bizonyítania a helyességet.
- Specifikációs dokumentumok: Írd meg a célokat, a megvalósítás részleteit és az ellenőrzési kritériumokat egy markdown fájlba, amelyen az ügynök iterál.
- Folyamatos teendőlista: Bontsd fel a komplex munkát egy listára, amelyet az ügynök láthat és szerkeszthet.
- Adversarial review (adversáriális felülvizsgálat): Körülbelül minden 20. iteráció után egy friss kontextusú alügynökkel vizsgáltasd felül a specifikációt és a megvalósítást. Ismételd a visszajelzések alapján, amíg összhangba nem kerülnek.
- Mielőtt elkezdenéd a munkát ezen a projekten, hozz létre három fájlt:
- 1. spec.md — egy teljes specifikáció célokkal, megvalósítási részletekkel, és egy ellenőrzési résszel, amely pontosan leírja, hogyan fogod bizonyítani, hogy minden rész működik.
- 2. todo.md — egy folyamatos teendőlista, amelyet munka közben szerkesztesz. Bontsd a komplex feladatokat ellenőrizhető alfeladatokra.
- 3. tests/ — egy mappa end-to-end tesztekkel, amelyek segítségével ellenőrizhetsz mindent, amit építesz. Futtasd őket, amíg mindegyik át nem megy.
- Munka közben: (a) minden változtatás előtt konzultálj a spec.md fájllal, (b) pipáld ki a todo.md elemeit, ahogy haladsz, (c) futtass teszteket minden érdemi commit után, (d) körülbelül minden 20. iteráció után hívj fel egy friss alügynököt azzal, hogy 'review spec.md and the current implementation for gaps' (vizsgáld felül a spec.md-t és a jelenlegi megvalósítást a hiányosságok szempontjából), és ismételd a visszajelzései alapján, amíg összhangba nem kerülnek.
- Ne kérj tőlem tisztázást semmiben, amit a specifikáció elolvasásával és a tesztek futtatásával meg tudsz oldani. Kezdd a specifikációval.