Az NVIDIA egyedi LLM-eket használ a chiptervezés és a mérnöki elemzések felgyorsítására

2023. november 6. · MI Történik? · 1 perc olvasás

Az NVIDIA saját, védett chiptervezési adatait használta fel olyan testreszabott nyelvi modellek kidolgozásához, amelyek segítenek a mérnökeinek a problémamegoldásban, az EDA (Electronic Design Automation) munkálatokban, valamint a hibák összegzésében és elemzésében. A projekt kiváló példa arra, hogyan tudják a rengeteg saját adattal rendelkező szervezetek a nyelvi modelleket a specifikus igényeikre szabni, és ezzel jobb teljesítményt elérni, mint a gyári alapmodellekkel. Az NVIDIA nyílt hozzáférésű LLaMa modelleket (7B és 13B) szabott testre, hogy azok hatékonyabbak legyenek a félvezető-tervezési és elemzési feladatokban. Konkrétan speciális előtanítást végeztek, és egyedi adat-visszakereső eszközöket építettek. Az NVIDIA két fő módszert alkalmazott: a tartomány-adaptív előtanítást (Domain-Adaptive Pre-training), ahol saját adataikat keverték nyilvános adatsorokkal, valamint a felügyelt finomhangolást (SFT), ahol a modellt egy nagy, párbeszédes interakciókat és kb. 1100 tartomány-specifikus instrukciót tartalmazó adatsoron tanították be. Saját tokenizálót is fejlesztettek a ritka szakmai kifejezések (zsargon) kezelésére.

Három területen értékelték: mérnöki asszisztens chatbot, EDA szkript generálás és hibák összegzése.
Akár ötszörös modellméret-csökkenést értek el az általános célú alapmodellekhez hasonló vagy jobb teljesítmény mellett.
A ChipNeMo 13B modell kvantálás nélkül is betölthető egyetlen A100 GPU memóriájába.
Specifikus chiptervezési feladatokban túlszárnyalta a jóval nagyobb LLaMa 2 70B modellt is.
Egyedi tokenizálót használtak a félvezetőipari szakzsargon pontosabb reprezentációjához.

Miért fontos?

Az ehhez hasonló eszközök előhírnökei annak, hogy a vállalatok hogyan fogják az AI-t saját hatékonyságuk növelésére használni. Bár az AI ma már sok hasznos dologra képes, ez leginkább a munkaerő támogatásában vagy az alacsony képzettséget igénylő folyamatok automatizálásában merül ki. Az AI eddig nehezen tudta felgyorsítani a szakértők munkáját az olyan bonyolult iparágakban, mint a chiptervezés. Az NVIDIA modelljei azt jelzik, hogy az élenjáró tech-cégek már olyan AI-rendszereket építenek, amelyek képesek saját produkciós rátájukat növelni. Ha ezek a megoldások beválnak, a technológiai fejlődés üteme exponenciálisan felgyorsulhat. ---

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

Az XPeng vezérigazgatója irányítja a humanoid robotok sorozatgyártását

1 órája

A Mondo Robotics bemutatta Benit, az autonóm kamerarobotot tartalomgyártók számára

9 órája

A Booster Robotics humanoidja falat is átütő rúgással debütált a futballbemutatón

12 órája

Tudj meg többet

NotebookLM használata: Így alakítsd át a jegyzeteidet okos asszisztenssé

ChatGPT használata a munkában: Gyakorlati útmutató irodai dolgozóknak