MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Főbb felismerések Andrej Karpathy mélyreható elemzéséből az AI működéséről

Andrej Karpathy, az OpenAI alapító tagja és a Tesla AI korábbi vezetője, egy átfogó, háromórás videót tett közzé, amelyben lebontja a ChatGPT és más nagy nyelvi modellek belső működését. A magyarázat végigkíséri egy AI-modell teljes életciklusát, kezdve a szűrt internetes adatok feldolgozásától egészen a több lépésből álló „explicit érvelésig”. Karpathy hangsúlyozza, hogy bár ezek a modellek hatékony asszisztensként működnek, továbbra is tökéletlen eszközök maradnak, amelyek emberi felügyeletet és ellenőrzést igényelnek.
Miért fontos?

Karpathy az AI-kutatás egyik legelismertebb alakja; képessége, hogy a komplex neurális hálózati fogalmakat emészthetővé tegye, segít a felhasználóknak megérteni, miért hallucinálnak a modellek, és hogyan lehet hatékonyabban promptolni őket. ---

Eredeti forrás megtekintése (angol) →