A Google kutatói szintetikus adatokkal egészítik ki a valódi adatkészleteket a nagyobb pontosság érdekében
A Google kutatói megmutatták, hogy egy adatkészletet (ImageNet) AI-generált képekkel kiegészítve jobb teljesítményt érhetnek el az adott adatkészleten tanított modellekkel. Ez arra utal, hogy a szintetikusan generált adatok nemcsak helyettesíthetik a valódi adatokat, hanem jobb eredményeket is lehetővé tehetnek, mint a valódi adatok önmagukban. Az eredmények számos konvolúciós és Transformer-alapú architektúra esetében érvényesek.
- Az ImageNet kiegészítése Imagen-generált mintákkal jelentős javulást hozott az osztályozási pontosságban.
- A szintetikus adatok javították a teljesítményt mind a ResNet, mind a Vision Transformer alapmodellek esetében.
- A teljesítmény tovább javul nagyobb mennyiségű szintetikus adattal és hosszabb tanítási idővel.
- A megközelítés azt mutatja, hogy a szintetikus és valódi képek keverése felülmúlja a kizárólag a valóságon alapuló tanítást.
Miért fontos?
Ennek komoly következményei vannak – azt sugallja, hogy a szintetikusan generált adatok felhasználhatók az AI-kutatás felgyorsítására és olyan magasabb teljesítményküszöbök elérésére, amelyeket korábban a való világban elérhető adatok mennyisége korlátozott.