A Nous Research kiadta a Hermes 3 modellt csúcskategóriás teljesítménnyel

NOUS RESEARCH

A Nous Research kiadta a Hermes 3 modellt csúcskategóriás teljesítménnyel

2024. augusztus 16. · MI Történik? · 1 perc olvasás

A Nous Research nemrég adta ki a Hermes 3-at, egy új open-source modellt, amely jelentős fejlesztéseket tartalmaz a szerepjáték, az ágens-feladatok (agentic tasks), a funkcióhívás (function calling), a többkörös beszélgetések és a hosszú kontextus-koherencia terén. A modellt a mainstream vállalati modellek semlegesebb és jobban irányítható alternatívájának tervezték.

A Hermes 3 három méretben (8B, 70B és 405B) érhető el, a 405B paraméteres modell pedig csúcskategóriás (state-of-the-art) teljesítményt nyújt a többi nyílt modellhez képest.
A modell instruct-tuned, vagyis arra lett betanítva, hogy hűen válaszoljon a felhasználói kérésekre és pontosan kövesse a megadott system promptokat, ellentétben az alap (base vagy foundation) modellekkel.
Hasonló vagy jobb teljesítményt ér el a Meta Llama-3.1 405B modelljéhez képest az ítélőképesség, a jutalom-modellezés, az értelmezhető problémamegoldás, a kódgenerálás és az eszközhasználat (tool use) terén.
A Hermes 3 már ingyenesen elérhető a Lambda Chat-en keresztül vagy a Nous Research Discord szerverén.

Miért fontos?

Egy ideje a Meta az open-source AI vezetője, de az olyan cégek, mint a Nous Research és a Mistral, felzárkóznak a legújabb Hermes 3 és Large 2 modelljeikkel. Minél több ingyenes, testre szabható és csúcstechnológiás AI érhető el a nyilvánosság számára, annál nagyobb az átláthatóság a világban. ---

Eredeti forrás megtekintése (angol) →