A Cosine bemutatta rekorddöntő AI szoftvermérnökét, Genie-t
A szoftverfejlesztés világa újabb mérföldkőhöz érkezett, miután a brit Cosine startup bemutatta legújabb fejlesztését, a Genie névre keresztelt autonóm szoftvermérnököt. A Y Combinator által támogatott vállalat célja az volt, hogy egy olyan mesterséges intelligenciát hozzon létre, amely nem csupán véletlenszerű kódolási próbálkozásokkal dolgozik, hanem valódi emberi gondolkodásmódot követve oldja meg a feladatokat. Az eredmény önmagáért beszél: a Genie az iparág egyik legelismertebb mérőszámán, az SWE-Bench teszten 30 százalékos eredményt ért el. Ez az teljesítmény jelentősen felülmúlja a korábbi rekordokat, beleértve a Cognition által fejlesztett Devin 13,9 százalékos eredményét, és elképesztő, 2196 százalékos növekedést jelent az OpenAI GPT-4 modelljéhez képest, ami új távlatokat nyit az AI-alapú kódolásban.
A Genie sikerének kulcsa egy egészen másfajta megközelítésben rejlik, mint amit a legtöbb mai LLM alkalmaz. Míg a piacon elérhető modellek többsége a próbálkozások és hibák módszerével, úgymond véletlenszerű kimeneteli tippekkel próbálkozik addig, amíg a kód működőképes nem lesz, a Cosine csapata egy tanítási folyamatot dolgozott ki. Alistair Pullen vezérigazgató elmondása szerint a modell fejlesztésekor arra fókuszáltak, hogy a Genie pontosan lássa, hogyan dolgozik egy hús-vér szoftvermérnök. A modell valós példákon keresztül tanulmányozta a programozók döntési mechanizmusait és logikai lépéseit, így a gép képes megérteni a döntések hátterét, ami lehetővé teszi számára, hogy önállóan navigáljon komplex kódolási problémák között. Ez a 2,5 millió dolláros seed tőkével támogatott startup tehát nem a nyers adatmennyiségre, hanem a minőségi munkamódszer elsajátítására alapozza modellje hatékonyságát.
Ez az áttörés azért bír kiemelt jelentőséggel, mert a szoftverek azok az állványzatok, amelyekre a teljes modern digitális világunk épül. A Genie már a jelenlegi állapotában is képes arra, hogy hibákat javítson, új funkciókat implementáljon a meglévő rendszerekbe, és átvállalja az unalmas, ismétlődő kódolási feladatokat, ezzel időt szabadítva fel az emberi mérnökök számára. A technológia igazi ígérete azonban a jövőben rejlik: olyan rendszerek kialakítása, amelyek képesek saját maguk létrehozására, szerkesztésére és folyamatos továbbfejlesztésére. Amennyiben ez a fajta autonómia általánossá válik a fejlesztésben, az nemcsak a szoftveripar növekedését gyorsíthatja fel drasztikusan, de sokak szerint az AGI, vagyis az általános mesterséges intelligencia elérésének is az egyik rejtett kulcsa lehet. A Genie megjelenése egyértelmű jele annak, hogy az AI nem csupán asszisztensként, hanem önálló szakértőként is hamarosan a mindennapjaink részévé válhat a fejlesztői csapatokban.
- A Cosine valós példákat mutat Genie modelljének a problémákon dolgozó programozókról
- Az egyes döntések mögötti logika megértésével Genie képes önállóan rájönni a kódolási problémák megoldására
- Genie 30%-ot ért el az SWE-Bench teszten, amely azt méri, hogyan teljesítenek az LLM-ek a különböző kódolási feladatokban
- Genie körülbelül 2196%-kal teljesít jobban, mint az OpenAI legmodernebb GPT-4 modellje
A kód az az állványzat, amely a nap mint nap használt weboldalak és alkalmazások mögött áll. Genie már most képes hibákat javítani, új funkciókat építeni és ismétlődő kódolási feladatokat automatizálni. A következő lépés: olyan szoftver, amely lényegében képes létrehozni, szerkeszteni és fejleszteni önmagát, megnyitva az utat a rohamos növekedés előtt. Egy teljesen autonóm szoftvermérnök lehet az AGI elérésének rejtett kulcsa is. ---