A DeepMind SCoRe módszere külső felügyelet nélkül javítja az LLM-ek önjavító képességét

2024. szeptember 26. · MI Történik? · 1 perc olvasás

A DeepMind kifejlesztette a SCoRe-t – egy megerősítéses tanuláson alapuló megközelítést, amely külső felügyelet nélkül 15,6%-kal javítja az LLM-ek önjavítását a MATH, és 9,1%-kal a HumanEval benchmarkokon. Ez a módszer arra összpontosít, hogy megtanítsa a modelleket saját hibáik azonosítására és kijavítására a gondolkodási folyamat során.

Megerősítéses tanuláson alapuló megközelítést alkalmaz a belső hibaészlelés elősegítésére.
15,6%-os javulást ér el a MATH benchmark teszteken.
9,1%-os növekedést mutat a HumanEval kódolási feladatoknál.
Nem igényel külső felügyeletet a teljesítménybeli javulás eléréséhez.

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

Az Apple bemutatja a GSM-Symbolic benchmarkot az LLM-ek matematikai érvelésének értékelésére

2024. október 17.

A Google frissítette a Gemini 1.5 Pro és Flash modelleket alacsonyabb árazással

2024. szeptember 26.

Az Anthropic Contextual Retrieval megoldása akár 49 százalékkal csökkenti a RAG hibákat

2024. szeptember 26.

Tudj meg többet

Nagy nyelvi modellek (LLM): Hogyan működnek a ChatGPT-féle rendszerek?

AI a mindennapi időmenedzsmentben: Hatékonyság határidőnapló nélkül