MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az NVIDIA egyedi LLM-eket használ a chiptervezés és a mérnöki elemzések felgyorsítására

Az NVIDIA saját, védett chiptervezési adatait használta fel olyan testreszabott nyelvi modellek kidolgozásához, amelyek segítenek a mérnökeinek a problémamegoldásban, az EDA (Electronic Design Automation) munkálatokban, valamint a hibák összegzésében és elemzésében. A projekt kiváló példa arra, hogyan tudják a rengeteg saját adattal rendelkező szervezetek a nyelvi modelleket a specifikus igényeikre szabni, és ezzel jobb teljesítményt elérni, mint a gyári alapmodellekkel. Az NVIDIA nyílt hozzáférésű LLaMa modelleket (7B és 13B) szabott testre, hogy azok hatékonyabbak legyenek a félvezető-tervezési és elemzési feladatokban. Konkrétan speciális előtanítást végeztek, és egyedi adat-visszakereső eszközöket építettek. Az NVIDIA két fő módszert alkalmazott: a tartomány-adaptív előtanítást (Domain-Adaptive Pre-training), ahol saját adataikat keverték nyilvános adatsorokkal, valamint a felügyelt finomhangolást (SFT), ahol a modellt egy nagy, párbeszédes interakciókat és kb. 1100 tartomány-specifikus instrukciót tartalmazó adatsoron tanították be. Saját tokenizálót is fejlesztettek a ritka szakmai kifejezések (zsargon) kezelésére.
Miért fontos?

Az ehhez hasonló eszközök előhírnökei annak, hogy a vállalatok hogyan fogják az AI-t saját hatékonyságuk növelésére használni. Bár az AI ma már sok hasznos dologra képes, ez leginkább a munkaerő támogatásában vagy az alacsony képzettséget igénylő folyamatok automatizálásában merül ki. Az AI eddig nehezen tudta felgyorsítani a szakértők munkáját az olyan bonyolult iparágakban, mint a chiptervezés. Az NVIDIA modelljei azt jelzik, hogy az élenjáró tech-cégek már olyan AI-rendszereket építenek, amelyek képesek saját produkciós rátájukat növelni. Ha ezek a megoldások beválnak, a technológiai fejlődés üteme exponenciálisan felgyorsulhat. ---

Eredeti forrás megtekintése (angol) →