DATA POINTS
A Self-Flow technika váltja fel a REPA-t a Black Forest képmodelljeiben
A Black Forest Labs kutatói bemutatták a Self-Flow-t, egy öntanuló flow matching keretrendszert, amely a generatív képességek mellett szemantikai reprezentációkat is tanul. A módszer „Dual-Timestep Scheduling”-et használ, amely különböző zajszinteket alkalmaz a tokeneken, hogy információs aszimmetriát hozzon létre, ami arra kényszeríti a modelleket, hogy a hiányzó információkat a sérült bemenetekből következtessék ki. Egyetlen, 4 milliárd paraméteres, 200 millió képen és 6 millió videón betanított modell felülmúlta a standard flow matching eljárást és a REPA-t a kép-, videó- és hanggenerálás terén, mindössze 100 000 nagy felbontású finomhangolási lépés után. A megközelítés jobb skálázhatóságot mutat a REPA-hoz képest, a teljesítménybeli különbség pedig tovább nő, ahogy a modell mérete 290 millióról 1 milliárd paraméterre emelkedik. A Self-Flow emellett hatékony multimodális betanítást tesz lehetővé egyetlen modellen, és a sikeres videó-akció előrejelzési feladatokon keresztül potenciált mutat a világmodell (world model) alkalmazásokban is.
Miért fontos?
A megközelítés jobb skálázhatóságot mutat a jelenlegi módszerekhez, például a REPA-hoz képest, és jelentős potenciállal bír a multimodális betanítás és a világmodell alkalmazások terén. ---