COHERE
A Cohere bemutatta az Aya 23-at, a legmodernebb többnyelvű LLM modellcsaládot
A C4AI, a Cohere nonprofit kutatási részlege elindította az Aya 23-at — egy legmodernebb többnyelvű LLM modellcsaládot, amely nyílt súlyokkal (open-source) rendelkezik és 23 különböző nyelvet támogat.
- Az Aya 23 egy hatékonyságra és hozzáférhetőségre tervezett 8 milliárd (8B) paraméteres modellel, valamint egy Command R architektúrán alapuló, fejlett 35 milliárd (35B) paraméteres modellel rendelkezik.
- A modellek a korábbi Aya 101 kezdeményezésre építenek, amely 101 nyelvet fedett le, most azonban inkább a nyelvi mélységre összpontosítanak.
- Az Aya 23 jelentősen túlteljesíti az Aya 101-et számos benchmark teszten, és megelőzi az olyan nyílt riválisokat is, mint a Google Gemma vagy a Mistral.
Miért fontos?
Ahogy az AI hatása világszerte érezhetővé válik, a csúcsmodellekhez való hozzáférés sorsdöntő kérdéssé válik a világ számos pontján. Ezen élvonalbeli többnyelvű modellek hozzáférésének demokratizálása hatalmas lépés annak biztosítása felé, hogy mindenki profitálhasson az AI gyors fejlődéséből. ---