Ipari bejelentések
A Factory bemutatta a Devinnél is jobb teljesítményt nyújtó autonóm „Code Droid” ágenseit
A Factory kilépett a stealth fázisból, célja pedig a szoftvermérnöki életciklus automatizálása. Az emberi fejlesztők kognitív folyamatainak modellezésével a „Code Droidok” élvonalbeli eredményeket értek el a SWE-bench teszten. A rendszer 19,27%-os pontszámot kapott, amivel jelentősen felülmúlta a többi neves AI szoftvermérnököt, például Devint.
- 19,27%-ot ért el a SWE-bench teszten, megelőzve Devin 13,86%-os eredményét
- Nem csupán szöveget jósol meg, hanem a szoftverfejlesztők kognitív folyamatait modellezi
- Az ismétlődő és összetett mérnöki feladatok autonóm automatizálására tervezték
- A teljes szoftverfejlesztési életciklus munkafolyamatainak modellezésére összpontosít
Miért fontos?
Ez jelentős ugrást jelent az autonóm ágensek képességeiben, elmozdulva az egyszerű kódkiegészítéstől a teljesen önálló mérnöki feladatok elvégzése felé. ---