MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az Apple kutatói módszert dolgoztak ki az AI-modellek frissítésének gördülékenyebbé tételére

Ha elég ideje használ LLM-eket, valószínűleg belefutott már ebbe a bosszantó problémába: hirtelen a megszokott promptja egy adott feladathoz már nem működik. Vagy kipróbálja valaki másét, és teljesen más eredményt kap. Sok esetben a frissítések a felelősek ezekért az ellentmondásokért: a fejlesztők finomhangolják modelljeiket a hallucinációk, hibák és egyéb problémák csökkentése érdekében. Azonban minden frissítésnél a korábbi munka egy része elveszik. Ennek eredményeként az LLM küszködhet olyan dolgokkal – a következtetési feladatoktól az írásig –, amelyekben korábban kiváló volt. Mit tehetünk ez ellen? Az Apple kutatói olyan megoldáson dolgoznak, amely megkönnyíti az átmenetet a régi és az új modellek között. Ez bonyolult probléma, mert a „negatív váltások” – amikor egy AI-modell elront valamit, amit korábban jól tudott – még akkor is gyakoriak, ha az LLM tanítási módszerei generációkon át változatlanok maradnak.
Miért fontos?

Amikor új frissítés érkezik, gyakran a paraméterszámra, a tokenekre vagy a benchmark teljesítményre koncentrálunk. De ugyanilyen fontos az LLM használatának tényleges élménye is. Az Apple kutatása azt mutatja, hogy a tech cégek egyre nagyobb figyelmet fordítanak a következetlenségi problémára, és próbálják visszaszorítani azt. ---

Eredeti forrás megtekintése (angol) →