Perszóna generátorok szimulálnak sokszínű emberi karaktereket és nézőpontokat
Ha meg akarjuk érteni, hogyan reagál a közönség az ajánlatainkra, a nagy nyelvi modellek (LLM-ek) képesek szimulálni olyan felhasználókat, akik válaszolnak a képességekre, funkciókra, promóciókra vagy árakra vonatkozó kérdésekre. Azonban az LLM-ek nem reagálnak olyan változatossággal, mint az emberek. A kutatók olyan módszert dolgoztak ki, amely arra ösztönzi az LLM-eket, hogy testreszabható attitűdökkel rendelkező perszónákat vegyenek fel.
What’s new: Davide Paglieri, Logan Cross és Google-beli kollégáik javasolták a Perszóna Generátorokat. Megközelítésük olyan kódot állít elő, amely arra ösztönzi az LLM-et, hogy 25, a teljes spektrumot lefedő perszónához állítson össze promptokat.
Key insight: Egy LLM emberi perszóna felvételére való rábírása általában egy hatékony prompt összeállításának kérdése (például: „Válaszoljon a következő kérdésre úgy, mintha a mai politikában Demokrata pártinak tartaná magát. . . .”). Azonban ez a megközelítés hajlamos átlagos válaszokat kiváltani, amelyek nem tükrözik azt a változatosságot, amelyet egy emberi populáció adna – még akkor sem, ha a prompt kifejezetten arra utasítja az LLM-et, hogy fogadjon el specifikus demográfiai jellemzőket. Egy alternatív megoldás az, ha a modellt arra utasítjuk, hogy programozottan módosítsa a perszóna promptokat, amíg azok olyan kimenetet nem produkálnak, amely az adott vélemények, attitűdök vagy aggodalmak meghatározott spektrumát lefedi. Adott iránymutatások alapján, amelyek meghatározzák a perszónapopuláció hatókörét (különösen az egyetértés és egyet nem értés fokai szerint rangsorolt attitűdöket), egy evolúciós algoritmus képes a modellt arra ösztönözni, hogy olyan promptkészletet állítson elő, amely a válaszok teljes spektrumát kiváltja.
Results: Egy új kontextus és diverzitási tengelyek megadásával a kapott perszónák következetesen felülmúlták a Nemotron Personas diverzitási mutatóit. A Nemotron Personas egy nagyméretű, amerikai demográfiai statisztikákon alapuló perszóna prompt adatkészlet, és a Concordia memóriagenerátor által gyermekkorból felnőttkorba generált emlékeken alapuló perszóna promptokat. Egy tesztkérdőív-készlet alapján a szerzők perszónái a lehetséges válaszok 82 százalékát fedték le, míg a Nemotron Personas 76 százalékot, a Concordia memóriagenerátor pedig 46 százalékot.
We’re thinking: A szintetikus perszónák izgalmas lehetőséget kínálnak a termékmenedzsment szűk keresztmetszetének leküzdésére, azaz annak a nehézségnek az elhárítására, hogy mit építsünk, amikor egy LLM promptolásával könnyedén építhetünk.
- A szerzők azzal kezdték, hogy a Gemini 2.5 Pro-t használták 30 kérdőív generálására különböző témákban, mint például egészségügy, pénzügyi műveltség és összeesküvés-elméletek. Minden kérdőív tartalmazott egy kontextust (a téma leírása), egy sor „diverzitási tengelyt” (például kockázattűrő képesség vagy intézményekbe vetett bizalom), valamint a tengelyekhez kapcsolódó kérdéseket, amelyekre egy 1 (teljes mértékben egyetértek) és 5 (teljes mértékben nem értek egyet) közötti skálán kellett válaszolni.
- Kódot hoztak létre (kezdetben a szerzők írták, majd az AlphaEvolve iteratívan frissítette), hogy kérdőívenként 25 perszóna promptot állítsanak elő.
- A perszónák válaszainak automatizálásához a szerzők a Concordiát, egy ügynök-alapú szimulációk építésére szolgáló könyvtárat használtak a Gemma 3-27B-IT promptolására. Az LLM felváltva vette fel az egyes perszónákat, és válaszolt a megfelelő kérdőívre. Minden perszóna esetében a válaszait vektorrá alakították.
- Az egyes kérdőívekre válaszoló perszónák közötti diverzitás értékeléséhez hat metrikát számítottak ki, mint például bármely két vektor közötti átlagos távolság és az, hogy a perszónapopuláció milyen mértékben fedte le az összes lehetséges választ.
- Az AlphaEvolve párhuzamosan dolgozott a kód 10 különböző változatán, iteratívan frissítve azokat, hogy maximalizálja a diverzitási metrikákat az összes perszóna között. 500 iteráció után a szerzők azt a kódot választották, amely az összes diverzitási metrika átlagát maximalizálta.
- Az inferencia során, egy adott kontextus és diverzitási tengelyek mellett, a rendszer 25 különböző perszónát hozott létre.
Miért fontos?
Azok a szervezetek, amelyek szélesíteni szeretnék közönségüket, profitálhatnak a szintetikus perszónákból, amelyek széles körben tükrözik a közvéleményt, és azok, amelyek szintetikus perszónákat hoznak létre a valós közönségükhöz, betekintést nyerhetnek egy sokszínűbb csoporttól. Ez a munka a célkitűzést az edzési adatokhoz való illesztésről (ami hajlamos a legvalószínűbb kimeneteket generálni, nem pedig a kilógókat) az összes kívánt lehetőség lefedésére helyezi át. A perszóna generátor optimalizálása, nem pedig az egyes perszónáké, szélesebb körű reprezentációt tesz lehetővé a várható felhasználói viselkedésről.