MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az OpenAI elhozta a Reinforcement Fine-Tuningot a 4o-minihez a fejlettebb logikai következtetés érdekében

A 4o-mini megkapta a Reinforcement Fine-Tuningot – az RFT arra tanítja a modelleket, hogy meghatározott módon érveljenek, így javítva a pontosságot az olyan feladatoknál, ahol a válaszok egyértelműen ellenőrizhetők. Az OpenAI ezen útmutatója esettanulmányokat is tartalmaz arról, hogyan használják a vállalatok az RFT-t.
Eredeti forrás megtekintése (angol) →