AI MA
A Samsung kutatójának apró, 7 millió paraméteres modellje túlszárnyalja a nagy érvelési modelleket
A Samsung kutatója, Alexia Jolicoeur-Martineau által kifejlesztett Tiny Recursion Model (TRM) egy mindössze 7 millió paraméteres neurális hálózat, amely állítólag bizonyos összetett érvelési feladatokban túlszárnyalja az olyan sokkal nagyobb modelleket, mint a GPT-4. Azzal, hogy saját jóslatait folyamatosan finomítja a nyers számítási kapacitás helyett, ez az áttörés azt sugallja, hogy a gondos architektúra-tervezés hajthatja az AI-innováció következő hullámát.
Miért fontos?
Ez azt sugallja, hogy az iparág a hatékonyabb, speciális modellek irányába mozdulhat el, amelyek jelentősen kevesebb számítási kapacitást igényelnek, mint a jelenlegi masszív LLM-ek, miközben megőrzik magas szintű érvelési képességeiket. ---