A Facebook MILS rendszere tréning nélküli generatív ellenséges megközelítéssel javítja az LLM teljesítményét
A Facebook egy elmés módszert tervezett az LLM-ek automatikus promptolására, hogy javítsa teljesítményüket számos területen. A megközelítés neve MILS (Multimodal Iterative LLM Solver), amelyet a Facebook „meglepően egyszerű, tréninget nem igénylő módszerként” ír le, amellyel multimodális képességekkel ruházhatjuk fel kedvenc LLM-ünket. Ezt az elképzelést lényegében a modern AI-korszak „generatív ellenséges hálózatainak” (GAN) nevezhetnénk. Míg a GAN-oknál egy generátor és egy diszkriminátor kölcsönhatása révén tanítottak be egy modellt, a MILS nem egy tényleges tanítási módszer – ehelyett a GAN-paradigmát használja, ahol az egyik fél tartalmat generál, a másik pedig pontozza azt, és a modell tanítása helyett a meglévő modellek hatalmas ökoszisztémáját használja ki, hogy egy adott modellel generáljon, egy másikkal pedig értékeljen.
- A rendszer egy LLM-et használ promptok generálására olyan eszközökhöz, mint a text-to-image rendszerek.
- Egy dedikált pontozó modell (például CLIP vagy képaláíró modellek) értékeli a kimenetet.
- A pontszámok visszakerülnek a generátorhoz, hogy egy új, javított prompt-készletet hozzon létre.
- A folyamat addig ismétlődik, amíg a pontozó modell meg nem állapítja a konvergenciát.
- A tesztek szerint a MILS felveszi a versenyt vagy meg is haladja a specifikus módszerek teljesítményét a kép- és videófeliratozásban, valamint a stílusátvitelben.
Miért fontos?
A MILS alapvetően a képesség-előhívás (capability elicitation) automatizálásának egyik módja. Ha van egy területed, ahol egy ismert, speciális rendszerrel pontszámot tudsz generálni, akkor a MILS segítségével bármilyen LLM-ből kihozhatod a lehető legjobb teljesítményt. Az a tény, hogy ez működik, rávilágít arra, mennyire elképesztően fejlettek a mai AI rendszerek. ---