MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

A thai-specifikus Typhoon modell túlszárnyalja a GPT-3.5-öt a helyi nyelvi benchmarkokon

Az SCB 10X kutatói kifejlesztették a Typhoon-t, egy 7 milliárd paraméteres nyelvi modellt, amelyet a thai nyelvre optimalizáltak. A Mistral-7B architektúrára épülő Typhoon-t egy egyedi thai adatkészleten finomhangolták, és speciális tokenizálót használ a thai írásmód jobb kezeléséhez. Hatékonyságának mérésére a kutatók létrehozták a „ThaiExam” benchmarkot, amely különféle nemzeti oktatási és szakmai vizsgákból áll.
Miért fontos?

A Typhoon bebizonyítja, hogy a kicsi, specializált modellek magas teljesítményt érhetnek el konkrét nyelveken vagy területeken. Ugyanakkor azt is mutatja, hogy az olyan hatalmas modellek, mint a GPT-4, továbbra is megőrzik teljesítménybeli előnyüket, rávilágítva a specializált kis modellek és az általános célú csúcsmodellek közötti folyamatos szakadékra.

Eredeti forrás megtekintése (angol) →