Az Apple bemutatja a WRAP technikát az adatállományok szintetikus adatokkal való bővítésére

2024. február 5. · MI Történik? · 1 perc olvasás

Az Apple kutatói kifejlesztették a Web Rephrase Augmented Pre-training (WRAP) eljárást, amely egy módszer a szöveges adatkészletek szintetikusan generált adatokkal való bővítésére. A megközelítés egy LLM-et használ a webes cikkek négy különböző stílusban történő átfogalmazására: könnyen érthető, kiváló minőségű angol, tömör és specifikus, valamint társalgási Q&A. A szintetikus adatok és a valós adatok 1:1 arányú keverésével javult a perplexitás és a zero-shot pontosság számos feladat során, miközben a számítási keret változatlan maradt.

Egy 7B paraméteres, instruction-tuned Mistral modellt használ az átfogalmazáshoz
A technikát a CommonCrawl adataira alkalmazták
Átlagosan több mint 10%-kal javítja a perplexitást a Pile adatkészlet részhalmazain
Több mint 2%-kal növeli a zero-shot kérdés-válasz pontosságot 13 különböző feladatnál
Egy 1.3B paraméteres GPT-stílusú modellen tesztelték
A kutatás jelzi, hogy az átfogalmazó modellnek elég „okosnak” (nagynak) kell lennie a teljesítménynövekedés eléréséhez

Miért fontos?

A világban bevezetett AI rendszerek többsége valószínűleg viszonylag kis méretű, specifikus célokra testreszabott modell lesz. Ezért a WRAP-hez hasonló technikák komoly ígéretet hordoznak a fejlesztők számára, mivel egyszerű módot kínálnak a teljesítmény javítására szintetikus adatokon keresztül. ---

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

A NASA X-59-es repülőgépe elérte a szuperszonikus sebességet, ami jelentős mérföldkő a repülésben

1 órája

Biotech startup kezeli az első emberi pácienst a sejtszintű öregedés visszafordítása érdekében

1 órája

A NEURA Robotics 1,4 milliárd dollárt gyűjtött az Amazon, az Nvidia és a Qualcomm bevonásával

3 órája