Perszóna generátorok szimulálnak sokszínű emberi karaktereket és nézőpontokat

2026. április 17. · MI Történik? · 3 perc olvasás

Ha meg akarjuk érteni, hogyan reagál a közönség az ajánlatainkra, a nagy nyelvi modellek (LLM-ek) képesek szimulálni olyan felhasználókat, akik válaszolnak a képességekre, funkciókra, promóciókra vagy árakra vonatkozó kérdésekre. Azonban az LLM-ek nem reagálnak olyan változatossággal, mint az emberek. A kutatók olyan módszert dolgoztak ki, amely arra ösztönzi az LLM-eket, hogy testreszabható attitűdökkel rendelkező perszónákat vegyenek fel. What’s new: Davide Paglieri, Logan Cross és Google-beli kollégáik javasolták a Perszóna Generátorokat. Megközelítésük olyan kódot állít elő, amely arra ösztönzi az LLM-et, hogy 25, a teljes spektrumot lefedő perszónához állítson össze promptokat. Key insight: Egy LLM emberi perszóna felvételére való rábírása általában egy hatékony prompt összeállításának kérdése (például: „Válaszoljon a következő kérdésre úgy, mintha a mai politikában Demokrata pártinak tartaná magát. . . .”). Azonban ez a megközelítés hajlamos átlagos válaszokat kiváltani, amelyek nem tükrözik azt a változatosságot, amelyet egy emberi populáció adna – még akkor sem, ha a prompt kifejezetten arra utasítja az LLM-et, hogy fogadjon el specifikus demográfiai jellemzőket. Egy alternatív megoldás az, ha a modellt arra utasítjuk, hogy programozottan módosítsa a perszóna promptokat, amíg azok olyan kimenetet nem produkálnak, amely az adott vélemények, attitűdök vagy aggodalmak meghatározott spektrumát lefedi. Adott iránymutatások alapján, amelyek meghatározzák a perszónapopuláció hatókörét (különösen az egyetértés és egyet nem értés fokai szerint rangsorolt attitűdöket), egy evolúciós algoritmus képes a modellt arra ösztönözni, hogy olyan promptkészletet állítson elő, amely a válaszok teljes spektrumát kiváltja. Results: Egy új kontextus és diverzitási tengelyek megadásával a kapott perszónák következetesen felülmúlták a Nemotron Personas diverzitási mutatóit. A Nemotron Personas egy nagyméretű, amerikai demográfiai statisztikákon alapuló perszóna prompt adatkészlet, és a Concordia memóriagenerátor által gyermekkorból felnőttkorba generált emlékeken alapuló perszóna promptokat. Egy tesztkérdőív-készlet alapján a szerzők perszónái a lehetséges válaszok 82 százalékát fedték le, míg a Nemotron Personas 76 százalékot, a Concordia memóriagenerátor pedig 46 százalékot. We’re thinking: A szintetikus perszónák izgalmas lehetőséget kínálnak a termékmenedzsment szűk keresztmetszetének leküzdésére, azaz annak a nehézségnek az elhárítására, hogy mit építsünk, amikor egy LLM promptolásával könnyedén építhetünk.

A szerzők azzal kezdték, hogy a Gemini 2.5 Pro-t használták 30 kérdőív generálására különböző témákban, mint például egészségügy, pénzügyi műveltség és összeesküvés-elméletek. Minden kérdőív tartalmazott egy kontextust (a téma leírása), egy sor „diverzitási tengelyt” (például kockázattűrő képesség vagy intézményekbe vetett bizalom), valamint a tengelyekhez kapcsolódó kérdéseket, amelyekre egy 1 (teljes mértékben egyetértek) és 5 (teljes mértékben nem értek egyet) közötti skálán kellett válaszolni.
Kódot hoztak létre (kezdetben a szerzők írták, majd az AlphaEvolve iteratívan frissítette), hogy kérdőívenként 25 perszóna promptot állítsanak elő.
A perszónák válaszainak automatizálásához a szerzők a Concordiát, egy ügynök-alapú szimulációk építésére szolgáló könyvtárat használtak a Gemma 3-27B-IT promptolására. Az LLM felváltva vette fel az egyes perszónákat, és válaszolt a megfelelő kérdőívre. Minden perszóna esetében a válaszait vektorrá alakították.
Az egyes kérdőívekre válaszoló perszónák közötti diverzitás értékeléséhez hat metrikát számítottak ki, mint például bármely két vektor közötti átlagos távolság és az, hogy a perszónapopuláció milyen mértékben fedte le az összes lehetséges választ.
Az AlphaEvolve párhuzamosan dolgozott a kód 10 különböző változatán, iteratívan frissítve azokat, hogy maximalizálja a diverzitási metrikákat az összes perszóna között. 500 iteráció után a szerzők azt a kódot választották, amely az összes diverzitási metrika átlagát maximalizálta.
Az inferencia során, egy adott kontextus és diverzitási tengelyek mellett, a rendszer 25 különböző perszónát hozott létre.

Miért fontos?

Azok a szervezetek, amelyek szélesíteni szeretnék közönségüket, profitálhatnak a szintetikus perszónákból, amelyek széles körben tükrözik a közvéleményt, és azok, amelyek szintetikus perszónákat hoznak létre a valós közönségükhöz, betekintést nyerhetnek egy sokszínűbb csoporttól. Ez a munka a célkitűzést az edzési adatokhoz való illesztésről (ami hajlamos a legvalószínűbb kimeneteket generálni, nem pedig a kilógókat) az összes kívánt lehetőség lefedésére helyezi át. A perszóna generátor optimalizálása, nem pedig az egyes perszónáké, szélesebb körű reprezentációt tesz lehetővé a várható felhasználói viselkedésről.

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

A Cursor lokális, 7 dolláros „Start” csomagot indít Indiában

1 órája

Ultra-realisztikus luxustermék-reklámképek generálása

10 órája

A Notion bevezette a „Notion as code” koncepciót a munkaterületek üzembe helyezéséhez

12 órája