Kutatók nyílt modelleket adaptálnak sebezhetőség-észlelésre korlátozott számítási kapacitás mellett

2024. február 19. · MI Történik? · 2 perc olvasás

A Huawei Orosz Kutatóintézetének kutatói megpróbáltak nyíltan hozzáférhető nyelvi modelleket használni sebezhetőség-észlelésre. Munkájuk útmutatóként és receptkönyvként szolgál azok számára, akik egy modellt valamilyen specifikus célra szeretnének adaptálni – ez különösen azoknak releváns, akik szűkös számítási kerettel gazdálkodnak, mivel a tanulmány tele van a csapat által tapasztalt „hardveres korlátokra” való hivatkozással.

Mit tettek: LoRA (Low-Rank Adaptation) eljárást használtak a 13B paraméteres WizardCoder modell finomhangolására (finetuning) egy sor összegyűjtött sebezhetőségi adatkészleten – mint a CVEfixes, a VCMatch és egy általuk összeállított, manuálisan kezelt adatkészlet (624 nyilvánosan közzétett sebezhetőség 205 nyílt forráskódú Java projektben). A veszteségfüggvényt (loss function) is megváltoztatták a következő-token predikcióról (ami a nyelvi modellezésnél megszokott) „egy olyan osztályozási veszteségre, amely csak az utolsó token jósolt valószínűségét használja ki”. A tesztek során azt találták, hogy „a finomhangolt WizardCoder felülmúlja a finomhangolt ContaBERT-et mind a ROC AUC, mind az F1 metrikák tekintetében a kiegyensúlyozott sebezhetőség-észlelési feladaton”, és ugyanezt a javulást mutatták ki kiegyensúlyozatlan feladatoknál is. „Ez előrelépés a korábbi CodeBERT-alapú modellekhez képest, valószínűleg a WizardCoder nagyobb modellkapacitásának és előtanítási korpuszának köszönhetően” – írják.

Low-Rank Adaptation (LoRA) eljárást használtak a 13B-s WizardCoder modell finomhangolásához.
CVEfixes, VCMatch és egy egyedi Java sebezhetőségi adatkészletet használtak fel.
A veszteségfüggvényt az utolsó token valószínűségén alapuló osztályozási veszteségre módosították.
A WizardCoder felülmúlta a korábbi CodeBERT-alapú modelleket a sebezhetőség-észlelési mutatókban.
A kutatás rávilágít a modellek adaptálásának módszereire jelentős hardveres korlátok között.

Miért fontos?

Az ehhez hasonló tanulmányok rávilágítanak arra, milyen egyszerűvé válik a nyíltan közzétett AI rendszerek adaptálása a legkülönfélébb feladatokra. Kicsit leegyszerűsítve, amit itt tettek: a) vettek egy ingyenes modellt, b) tettek néhány módosítást a veszteségfüggvényen a feladathoz mérten, c) összegyűjtöttek egy adatkészletet főleg más nyílt forrásokból, és d) ingyenes finomhangolási technológiát használtak a rendszer adaptálásához. Van itt néhány mozgó alkatrész, de a lényeg: ez egy jól érthető folyamat és könnyen kivitelezhető, még akkor is, ha nincs sok számítógépünk. Összességében ez azt mutatja, hogy az AI rendszerek terén képességi és telepítési bőség előtt állunk – rengeteg okosabb megoldás vár ránk specifikus felhasználási esetekre, csak időt kell szánni az adaptálásukra.

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

A Pi chatbot magas érzelmi intelligenciát és empatikus interakciókat kínál

2026. május 23.

A Quora az AI felé fordul a több chatbot-modellt összesítő Poe alkalmazással

2026. május 23.

A Google Gemini alkalmazás "Jegyzetfüzeteket" vezet be projektekhez

2026. április 9.