ANTHROPIC
Az Anthropic kutatása feltárja a Claude AI belső gondolati folyamatait
Az Anthropic két kutatási dokumentumot tett közzé, amelyek feltárják, hogyan dolgozza fel az információkat Claude nevű AI-asszisztensük, segítve az olyan képességek mögött álló belső mechanizmusok megértését, mint a többnyelvű érvelés és a fejlett tervezés.
- A kutatók kifejlesztettek egy "AI-mikroszkópot", amely feltárja a modell belső „áramköreit”, megmutatva, hogyan alakítja át a Claude a bemeneti adatokat kimenetté a kulcsfontosságú feladatok során.
- A Claude egy univerzális „gondolati nyelvet” használ a különböző nyelveken, közös fogalmi feldolgozással az angol, a francia és a kínai nyelv esetében.
- Versíráskor a Claude több szót is előre tervez, azonosítva a rímelési lehetőségeket, mielőtt felépítené a sorokat, hogy elérje a tervezett szavakat.
- A csapat felfedezett egy alapbeállítást is, amely megakadályozza a találgatást, hacsak nincs meg a kellő magabiztosság, ami segít megmagyarázni a hallucinációk megelőzésének működését.
Miért fontos?
Minél közelebb kerülünk a szuperintelligens AI-hoz, annál fontosabbá válik annak megértése, hogyan dolgoznak a modellek belülről. Mivel a kutatások már részletezik az AI megtévesztő tulajdonságait, és egyre erősebb rendszerek integrálódnak az életünkbe világszerte, a belső működés feltörése napról napra döntőbb jelentőségűvé válik. ---