Az AutoCoder felülmúlja a GPT-4 Turbót a Human Eval kódolási teljesítménymérésen

2024. május 30. · MI Történik? · 1 perc olvasás

Kutatók bemutatták az AutoCoder-t, egy új kódoló modellt, amelyet az automatizált programozás határainak feszegetésére terveztek. Ez az első kódoló modell, amely felülmúlta a GPT-4 Turbót és a GPT-4o-t a Human Eval teszten, kiemelkedő technikai szakértelmet tanúsítva.

90,9%-os pass@1 pontszámot ért el a Human Eval teszten
Továbbfejlesztett kódértelmezővel (code interpreter) rendelkezik
Képes külső csomagok telepítésére a futtatás során
A kódolási pontosság tekintetében felülmúlja a vezető saját tulajdonú modelleket

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

Az OpenAI elindítja a SimpleQA benchmarkot az LLM-ek tényszerűségének és hallucinációinak mérésére

2024. október 31.

Kutatások feltárják: Az LLM-ek specifikus belső tokenekben kódolják az igazságtartalmat

2024. október 10.

A HippoRAG keretrendszer akár 20 százalékkal növeli a RAG hatékonyságát

2024. május 30.

Tudj meg többet

AI programozás: Hogyan építs saját alkalmazást kódolási tudás nélkül