MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

A Self-Align technika szintetikus adatokat használ a hatékony nyelvmodellek beindításához

A CMU, az IBM Research és a UMass Amherst kutatói kidolgoztak egy módszert, amellyel AI által generált kimeneteket használnak jobb nyelvmodellek tanítására. A Self-Align technika nagyon hasonlít az Anthropic Constitutional AI megközelítéséhez, és végső soron a következőkből áll: kérjünk meg embereket, hogy írjanak néhány irányadó elvet az AI rendszer viselkedésére vonatkozóan, és kérjük meg az AI-t, hogy generálja le az adatokat, amelyekkel beindítható ebben a normatív keretben. Az átfogó cél olyan AI ágensek fejlesztése, amelyek képesek segítőkész, etikus és megbízható válaszokat adni a felhasználói kérdésekre, beleértve az ellenségeseket is, miközben proaktívan, nem kitérő módon kezelik a káros megkereséseket. Ennek demonstrálására a kutatók a Dromedary-t, egy LLaMA-65B súlyokon alapuló modellt tanítottak be.
Miért fontos?

A self-align-hoz hasonló megközelítések két dolgot mutatnak nekünk: 1) a kortárs nyelvmodellek elég jók ahhoz, hogy kiváló minőségű adatokat generáljanak, és 2) ezek az adatok felhasználhatók a modell beindítására a magasabb teljesítmény elérése érdekében. Ez egy újabb példa arra, hogy 2023-ban az AI kutatás hogyan kezd el önmagára épülni. ---

Eredeti forrás megtekintése (angol) →