AI KUTATÁS
A Microsoft Orca 13B a GPT-4 érvelését utánozza a teljesítmény növelése érdekében
A Microsoft bemutatja az Orcát – egy 13 milliárd paraméteres modellt, amely a kereskedelmi LLM-ek, például a GPT-4 érvelési folyamatát utánozza, felülmúlva a Vicuna teljesítményét és elérve a ChatGPT-szintű képességeket. Ez a modell megmutatja, hogyan tanulhatnak a kisebb modellek komplex logikát nagyobb társaiktól.
- 13B paraméteres modell, amelyet utánzásos tanulással (imitation learning) képeztek ki
- Felülmúlja a Vicunát és más előkelő helyen rangsorolt open-source modelleket
- A ChatGPT-hez mérhető teljesítményszinteket ér el
Miért fontos?
Az Orca utat mutat a rendkívül alkalmas, költséghatékony modellek létrehozásához, amelyek kifinomult érvelési készségekkel rendelkeznek anélkül, hogy a billió paraméteres rendszerek hatalmas számítási igényeire lenne szükségük. ---