A Meta megerősítéses tanulással (reinforcement learning) javítja a Facebook-hirdetések átkattintási arányát
Az AI iparosításának hatékonyságát jelzi, hogy a Facebook kutatást tett közzé a megerősítéses tanulás (RL) alkalmazásáról az LLM-ek által generált hirdetésszövegek javítására. Egy nagyszabású, 10 hetes A/B teszt során, amely közel 35 000 hirdetőt és 640 000 hirdetésvariációt érintett, megállapították, hogy az „AdLlama” 6,7%-kal javította az átkattintási arányokat a válogatott hirdetéseken tanított felügyelt imitációs modellhez képest. A Facebook eredetileg felügyelt finomhangolással (SFT) készített AI-írott hirdetéseket, szintetikus és bérírók által készített adatok alapján. A további javítás érdekében egy teljesítmény-jutalmazási modellt tanítottak a Meta hirdetési adatainak archívumán, lehetővé téve a rendszer számára, hogy a szövegvariációkat közvetlenül a konkrét átkattintási arányokhoz kösse. Ezt a jutalmazási modellt használták fel azután az LLM RL-alapú finomhangolásához.
- 6,7%-os javulást értek el az átkattintási arányokban egy hatalmas A/B teszt során.
- A Meta korábbi hirdetési teljesítményadatain alapuló jutalmazási modellt alkalmaztak.
- Átálltak a felügyelt finomhangolásról (SFT) a megerősítéses tanulásra (RL) a jobb optimalizálás érdekében.
- A Llama architektúrára épülő „AdLlama” modellen alkalmazták.
Miért fontos?
Ez megmutatja, hogyan válnak az AI-technikák a nagy platformok központi bevételi forrásainak szerves részévé. Az átkattintási arány 6,7%-os javulása jelentősen hatékonyabb ügyfélszerzést jelent több ezer vállalkozás számára.