A Facebook MILS rendszere tréning nélküli generatív ellenséges megközelítéssel javítja az LLM teljesítményét

2025. február 3. · MI Történik? · 1 perc olvasás

A Facebook egy elmés módszert tervezett az LLM-ek automatikus promptolására, hogy javítsa teljesítményüket számos területen. A megközelítés neve MILS (Multimodal Iterative LLM Solver), amelyet a Facebook „meglepően egyszerű, tréninget nem igénylő módszerként” ír le, amellyel multimodális képességekkel ruházhatjuk fel kedvenc LLM-ünket. Ezt az elképzelést lényegében a modern AI-korszak „generatív ellenséges hálózatainak” (GAN) nevezhetnénk. Míg a GAN-oknál egy generátor és egy diszkriminátor kölcsönhatása révén tanítottak be egy modellt, a MILS nem egy tényleges tanítási módszer – ehelyett a GAN-paradigmát használja, ahol az egyik fél tartalmat generál, a másik pedig pontozza azt, és a modell tanítása helyett a meglévő modellek hatalmas ökoszisztémáját használja ki, hogy egy adott modellel generáljon, egy másikkal pedig értékeljen.

A rendszer egy LLM-et használ promptok generálására olyan eszközökhöz, mint a text-to-image rendszerek.
Egy dedikált pontozó modell (például CLIP vagy képaláíró modellek) értékeli a kimenetet.
A pontszámok visszakerülnek a generátorhoz, hogy egy új, javított prompt-készletet hozzon létre.
A folyamat addig ismétlődik, amíg a pontozó modell meg nem állapítja a konvergenciát.
A tesztek szerint a MILS felveszi a versenyt vagy meg is haladja a specifikus módszerek teljesítményét a kép- és videófeliratozásban, valamint a stílusátvitelben.

Miért fontos?

A MILS alapvetően a képesség-előhívás (capability elicitation) automatizálásának egyik módja. Ha van egy területed, ahol egy ismert, speciális rendszerrel pontszámot tudsz generálni, akkor a MILS segítségével bármilyen LLM-ből kihozhatod a lehető legjobb teljesítményt. Az a tény, hogy ez működik, rávilágít arra, mennyire elképesztően fejlettek a mai AI rendszerek. ---

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

A Google 2000 nyugdíjas Pixel telefonból épít szuperszámítógépet

8 órája

A Moonshot AI kiadta a nyílt forráskódú Kimi 2.7-Code modellt

10 órája

Az AARRI-Bench etikus és gondos kutatógyakornokként értékeli az AI-ágenseket

12 órája

Tudj meg többet

Generatív AI közérthetően: Hogyan készít képet, szöveget és zenét az AI?

Nagy nyelvi modellek (LLM): Hogyan működnek a ChatGPT-féle rendszerek?