MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Kutatók nyílt modelleket adaptálnak sebezhetőség-észlelésre korlátozott számítási kapacitás mellett

A Huawei Orosz Kutatóintézetének kutatói megpróbáltak nyíltan hozzáférhető nyelvi modelleket használni sebezhetőség-észlelésre. Munkájuk útmutatóként és receptkönyvként szolgál azok számára, akik egy modellt valamilyen specifikus célra szeretnének adaptálni – ez különösen azoknak releváns, akik szűkös számítási kerettel gazdálkodnak, mivel a tanulmány tele van a csapat által tapasztalt „hardveres korlátokra” való hivatkozással. Mit tettek: LoRA (Low-Rank Adaptation) eljárást használtak a 13B paraméteres WizardCoder modell finomhangolására (finetuning) egy sor összegyűjtött sebezhetőségi adatkészleten – mint a CVEfixes, a VCMatch és egy általuk összeállított, manuálisan kezelt adatkészlet (624 nyilvánosan közzétett sebezhetőség 205 nyílt forráskódú Java projektben). A veszteségfüggvényt (loss function) is megváltoztatták a következő-token predikcióról (ami a nyelvi modellezésnél megszokott) „egy olyan osztályozási veszteségre, amely csak az utolsó token jósolt valószínűségét használja ki”. A tesztek során azt találták, hogy „a finomhangolt WizardCoder felülmúlja a finomhangolt ContaBERT-et mind a ROC AUC, mind az F1 metrikák tekintetében a kiegyensúlyozott sebezhetőség-észlelési feladaton”, és ugyanezt a javulást mutatták ki kiegyensúlyozatlan feladatoknál is. „Ez előrelépés a korábbi CodeBERT-alapú modellekhez képest, valószínűleg a WizardCoder nagyobb modellkapacitásának és előtanítási korpuszának köszönhetően” – írják.
Miért fontos?

Az ehhez hasonló tanulmányok rávilágítanak arra, milyen egyszerűvé válik a nyíltan közzétett AI rendszerek adaptálása a legkülönfélébb feladatokra. Kicsit leegyszerűsítve, amit itt tettek: a) vettek egy ingyenes modellt, b) tettek néhány módosítást a veszteségfüggvényen a feladathoz mérten, c) összegyűjtöttek egy adatkészletet főleg más nyílt forrásokból, és d) ingyenes finomhangolási technológiát használtak a rendszer adaptálásához. Van itt néhány mozgó alkatrész, de a lényeg: ez egy jól érthető folyamat és könnyen kivitelezhető, még akkor is, ha nincs sok számítógépünk. Összességében ez azt mutatja, hogy az AI rendszerek terén képességi és telepítési bőség előtt állunk – rengeteg okosabb megoldás vár ránk specifikus felhasználási esetekre, csak időt kell szánni az adaptálásukra.

Eredeti forrás megtekintése (angol) →