A Cosine bemutatta rekorddöntő AI szoftvermérnökét, Genie-t

2026. május 24. · MI Történik? · 2 perc olvasás

A szoftverfejlesztés világa újabb mérföldkőhöz érkezett, miután a brit Cosine startup bemutatta legújabb fejlesztését, a Genie névre keresztelt autonóm szoftvermérnököt. A Y Combinator által támogatott vállalat célja az volt, hogy egy olyan mesterséges intelligenciát hozzon létre, amely nem csupán véletlenszerű kódolási próbálkozásokkal dolgozik, hanem valódi emberi gondolkodásmódot követve oldja meg a feladatokat. Az eredmény önmagáért beszél: a Genie az iparág egyik legelismertebb mérőszámán, az SWE-Bench teszten 30 százalékos eredményt ért el. Ez az teljesítmény jelentősen felülmúlja a korábbi rekordokat, beleértve a Cognition által fejlesztett Devin 13,9 százalékos eredményét, és elképesztő, 2196 százalékos növekedést jelent az OpenAI GPT-4 modelljéhez képest, ami új távlatokat nyit az AI-alapú kódolásban.

A Genie sikerének kulcsa egy egészen másfajta megközelítésben rejlik, mint amit a legtöbb mai LLM alkalmaz. Míg a piacon elérhető modellek többsége a próbálkozások és hibák módszerével, úgymond véletlenszerű kimeneteli tippekkel próbálkozik addig, amíg a kód működőképes nem lesz, a Cosine csapata egy tanítási folyamatot dolgozott ki. Alistair Pullen vezérigazgató elmondása szerint a modell fejlesztésekor arra fókuszáltak, hogy a Genie pontosan lássa, hogyan dolgozik egy hús-vér szoftvermérnök. A modell valós példákon keresztül tanulmányozta a programozók döntési mechanizmusait és logikai lépéseit, így a gép képes megérteni a döntések hátterét, ami lehetővé teszi számára, hogy önállóan navigáljon komplex kódolási problémák között. Ez a 2,5 millió dolláros seed tőkével támogatott startup tehát nem a nyers adatmennyiségre, hanem a minőségi munkamódszer elsajátítására alapozza modellje hatékonyságát.

Ez az áttörés azért bír kiemelt jelentőséggel, mert a szoftverek azok az állványzatok, amelyekre a teljes modern digitális világunk épül. A Genie már a jelenlegi állapotában is képes arra, hogy hibákat javítson, új funkciókat implementáljon a meglévő rendszerekbe, és átvállalja az unalmas, ismétlődő kódolási feladatokat, ezzel időt szabadítva fel az emberi mérnökök számára. A technológia igazi ígérete azonban a jövőben rejlik: olyan rendszerek kialakítása, amelyek képesek saját maguk létrehozására, szerkesztésére és folyamatos továbbfejlesztésére. Amennyiben ez a fajta autonómia általánossá válik a fejlesztésben, az nemcsak a szoftveripar növekedését gyorsíthatja fel drasztikusan, de sokak szerint az AGI, vagyis az általános mesterséges intelligencia elérésének is az egyik rejtett kulcsa lehet. A Genie megjelenése egyértelmű jele annak, hogy az AI nem csupán asszisztensként, hanem önálló szakértőként is hamarosan a mindennapjaink részévé válhat a fejlesztői csapatokban.

A Cosine valós példákat mutat Genie modelljének a problémákon dolgozó programozókról
Az egyes döntések mögötti logika megértésével Genie képes önállóan rájönni a kódolási problémák megoldására
Genie 30%-ot ért el az SWE-Bench teszten, amely azt méri, hogyan teljesítenek az LLM-ek a különböző kódolási feladatokban
Genie körülbelül 2196%-kal teljesít jobban, mint az OpenAI legmodernebb GPT-4 modellje

Miért fontos?

A kód az az állványzat, amely a nap mint nap használt weboldalak és alkalmazások mögött áll. Genie már most képes hibákat javítani, új funkciókat építeni és ismétlődő kódolási feladatokat automatizálni. A következő lépés: olyan szoftver, amely lényegében képes létrehozni, szerkeszteni és fejleszteni önmagát, megnyitva az utat a rohamos növekedés előtt. Egy teljesen autonóm szoftvermérnök lehet az AGI elérésének rejtett kulcsa is. ---

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

A Cursor rohamosan válik a programozás ChatGPT-jévé

2026. május 24.

Terv a sérülékeny AI-számítógépek világűrbe juttatására

2026. május 24.

GPT-5.6 prompting útmutató és új, képernyő-tudatos AI frissítések

6 órája