MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az Anthropic automatizálja az AI biztonsági kutatást Claude Opus agentekkel

Az AI területén dolgozók közül sokak számára a végső cél maga az AI kutatás automatizálása. Most az Anthropic Fellows Program és az Anthropic kutatói közzétettek néhány korai jelet, amelyek szerint az AI kutatás automatizálása ma már lehetséges – bár sok megszorítás érvényes. „Azt kérdezzük: képes-e Claude saját alignment ötleteket fejleszteni, tesztelni és elemezni?” – írják a kutatók. Sikerrel jártak, és képesek voltak „autonóm AI agenteket építeni, amelyek ötleteket javasolnak, kísérleteket futtatnak és iterálnak egy nyitott kutatási problémán: hogyan lehet erős modellt tréningezni kizárólag egy gyengébb modell szupervíziója alapján. Ezek az agentek felülmúlják az emberi kutatókat, ami arra utal, hogy az ilyen típusú kutatás automatizálása már gyakorlatban is megvalósítható.”
Miért fontos?

Ez a kutatás arra utal, hogy „az outcome-gradable problémákkal kapcsolatos automatizált kutatás már gyakorlatilag megvalósítható” – jegyzik meg a szerzők. „Az alignment kutatás kulcsfontosságú szűk keresztmetszete az, hogy az ötletek javasolásától és végrehajtásától eljussunk az evals (értékelések) tervezéséhez: meg kell találnunk a megfelelő metrikákat (data, modellek), amelyeket az AAR-ok megbízhatóan képesek optimalizálni overfitting nélkül. Izgatottak vagyunk, hogy ma már alkalmazhatjuk az automatizálást ambiciózus alignment kutatásokra.” Más szóval – most van egy korai jelünk arra, hogy egy kis szakértői emberi kalibrációval az AI rendszerek autonóm módon képesek végigvinni a kutatást, és olyan eredményeket produkálni, amelyek segítségével javítható egy modell teljesítménye egy adott probléma ellen. Ennek következményei egy olyan machine economy terjeszkedésére mutatnak, amely folyamatosan rájön, hogyan javíthatja automatikusan saját teljesítményét az egyre bővülő feladatok sorában. Az igazi kérdés az, hogy mikor lesznek képesek a gépek hatékonyan javasolni saját kutatási irányaikat – ami megszüntetné az egyetlen értelmes szerepet, amit az ember játszott ebben a kutatásban. Ezen a ponton már nemcsak egy machine economy terjeszkedéséről lehet szó, hanem egy teljes machine civilization kiterjedéséről. ---

Eredeti forrás megtekintése (angol) →