Az Anthropic közösségi forrásból gyűjt értékeket egy AI-kísérlethez
Az Anthropic technológiai AI startup egyedülálló kísérletet hajtott végre, amelynek során közösségi forrásból gyűjtött értékek alapján formálta át a rendszer működését. A projekt keretében pontosan ezer embert kértek meg arra, hogy javasoljanak egyedi szabályokat és irányelveket a vállalat saját fejlesztésű chatbotjához, a Claude-hoz. A beérkező javaslatokból a kutatók összeállítottak egy átfogó keretrendszert, amelyet nyilvános alkotmány néven emlegetnek. Ezt követően egy speciális mini verziót tanítottak be, amely szigorúan ezen kollektív értékrend mentén hozza meg a döntéseit. Az első kísérleti eredmények azt mutatják, hogy a közösségi alapokon nyugvó Claude szinte teljesen megegyező szinten teljesített a vállalat eredeti modelljével, ami komoly mérföldkövet jelenthet a szektorban.
A fejlesztési folyamat részletei rávilágítanak arra, hogy a technológia világa egyre nyitottabbá válik az alternatív megoldásokra. Az ezer fős csoport bevonásával az Anthropic képes volt egy olyan strukturált szabályrendszert létrehozni, amely közvetlenül a társadalmi elvárásokon alapul. Az így létrejött nyilvános alkotmány közvetlenül határozta meg a mini LLM modell finomhangolását és alapvető működési mechanizmusait. A kísérletek során végrehajtott tesztek bebizonyították, hogy egy ilyen széles körű összefogásból származó iránymutatás nem rontja a rendszer hatékonyságát, és a közösségi forrásból táplálkozó chatbot ugyanolyan stabilan és precízen reagál a különböző helyzetekben, mint a belső szakértők által irányított változat.
Ez a figyelemreméltó eredmény azért bír kiemelkedő fontossággal, mert egyértelműen arra utal, hogy a kollektív irányítás nemcsak elméletben, hanem a gyakorlatban is teljesen működőképes koncepció lehet. A mesterséges intelligencia jelenlegi korszakában a rendszerek etikai korlátait és szabályait többnyire maguk a tech vállalatok határozzák meg zárt ajtók mögött. Az Anthropic kísérlete azonban egy új utat mutat, ahol a szélesebb nyilvánosság is közvetlen hatást gyakorolhat az AI viselkedésére anélkül, hogy az a teljesítmény rovására menne. A kollektív irányítás sikere hozzájárulhat ahhoz, hogy a jövőben biztonságosabb, elfogadottabb és az emberi értékekkel jobban harmonizáló modellek szülessenek.