MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

A Microsoft Orca modelljei szintetikus adatokat használnak a logikai következtetés tanítására

A Microsoft Orca és Orca 2 modelljei testreszabott, kiváló minőségű szintetikus adatokat használtak fel, hogy a kisebb nyelvi modelleket fejlettebb logikai képességekkel ruházzák fel. Az Orca-2 kifejezetten arra tanítja a kisméretű nyelvi modelleket, hogyan érveljenek, fejlett tanítási módszereket alkalmazva és a GPT-4 komplex magyarázataiból tanulva. Ez a megközelítés lehetővé teszi a kisebb modellek számára, hogy a náluk 5-10-szer nagyobb modellekkel összemérhető logikai szintet érjenek el.
Miért fontos?

Az Orca mintát ad arra, hogyan tehetjük okosabbá a kis modelleket a paraméterszám növelése nélkül, bizonyítva, hogy az utasítások minősége a kulcs a fejlett logikai érveléshez.

Eredeti forrás megtekintése (angol) →