Kutatók nyílt modelleket adaptálnak sebezhetőség-észlelésre korlátozott számítási kapacitás mellett
- Low-Rank Adaptation (LoRA) eljárást használtak a 13B-s WizardCoder modell finomhangolásához.
- CVEfixes, VCMatch és egy egyedi Java sebezhetőségi adatkészletet használtak fel.
- A veszteségfüggvényt az utolsó token valószínűségén alapuló osztályozási veszteségre módosították.
- A WizardCoder felülmúlta a korábbi CodeBERT-alapú modelleket a sebezhetőség-észlelési mutatókban.
- A kutatás rávilágít a modellek adaptálásának módszereire jelentős hardveres korlátok között.
Az ehhez hasonló tanulmányok rávilágítanak arra, milyen egyszerűvé válik a nyíltan közzétett AI rendszerek adaptálása a legkülönfélébb feladatokra. Kicsit leegyszerűsítve, amit itt tettek: a) vettek egy ingyenes modellt, b) tettek néhány módosítást a veszteségfüggvényen a feladathoz mérten, c) összegyűjtöttek egy adatkészletet főleg más nyílt forrásokból, és d) ingyenes finomhangolási technológiát használtak a rendszer adaptálásához. Van itt néhány mozgó alkatrész, de a lényeg: ez egy jól érthető folyamat és könnyen kivitelezhető, még akkor is, ha nincs sok számítógépünk. Összességében ez azt mutatja, hogy az AI rendszerek terén képességi és telepítési bőség előtt állunk – rengeteg okosabb megoldás vár ránk specifikus felhasználási esetekre, csak időt kell szánni az adaptálásukra.