Az Apple kutatói módszert dolgoztak ki az AI-modellek frissítésének gördülékenyebbé tételére

AZ AI JÖVŐJE

Az Apple kutatói módszert dolgoztak ki az AI-modellek frissítésének gördülékenyebbé tételére

2024. július 17. · MI Történik? · 1 perc olvasás

Ha elég ideje használ LLM-eket, valószínűleg belefutott már ebbe a bosszantó problémába: hirtelen a megszokott promptja egy adott feladathoz már nem működik. Vagy kipróbálja valaki másét, és teljesen más eredményt kap. Sok esetben a frissítések a felelősek ezekért az ellentmondásokért: a fejlesztők finomhangolják modelljeiket a hallucinációk, hibák és egyéb problémák csökkentése érdekében. Azonban minden frissítésnél a korábbi munka egy része elveszik. Ennek eredményeként az LLM küszködhet olyan dolgokkal – a következtetési feladatoktól az írásig –, amelyekben korábban kiváló volt. Mit tehetünk ez ellen? Az Apple kutatói olyan megoldáson dolgoznak, amely megkönnyíti az átmenetet a régi és az új modellek között. Ez bonyolult probléma, mert a „negatív váltások” – amikor egy AI-modell elront valamit, amit korábban jól tudott – még akkor is gyakoriak, ha az LLM tanítási módszerei generációkon át változatlanok maradnak.

A kutatók olyan mérőszámokat hoztak létre, amelyekkel kimutathatók az eltérések az LLM egyes verziói között.
Ezeket az adatokat felhasználva egy speciális LLM-et, úgynevezett kompatibilitási modellt tanítottak be az eltérések önálló jelzésére.
Ez a megközelítés mintegy 40%-kal csökkentette a modellgenerációk közötti következetlenségeket.

Miért fontos?

Amikor új frissítés érkezik, gyakran a paraméterszámra, a tokenekre vagy a benchmark teljesítményre koncentrálunk. De ugyanilyen fontos az LLM használatának tényleges élménye is. Az Apple kutatása azt mutatja, hogy a tech cégek egyre nagyobb figyelmet fordítanak a következetlenségi problémára, és próbálják visszaszorítani azt. ---

Eredeti forrás megtekintése (angol) →