A finomhangolt LLM-ek felveszik a versenyt a specializált modellekkel a kémiai tulajdonságok előrejelzésében
Számítógépes kémikusok bebizonyították, hogy az általános célú nagy nyelvi modellek (LLM-ek) meglepően alkalmassá tehetők kémiai kutatási kérdések megválaszolására. Az olyan rendszerek minimális adattal történő finomhangolásával, mint a GPT-3, a modellek képesek elérni vagy akár meg is haladni a specializált eszközök teljesítményét a molekuláris tulajdonságok vagy a reakcióhozamok előrejelzése során.
- A kutatók kémiai vegyületekről szóló szakirodalmat gyűjtöttek össze, és az adatokat nagyjából 30 kérdés-felelet párrá alakították a finomhangoláshoz.
- A rendszer sikeresen jósolta meg olyan „ismeretlen” anyagok és ötvözetek tulajdonságait, amelyek nem szerepeltek az eredeti tanítókészletben.
- A technika kizárólag kémiai képleteket használ, és a fizikai tulajdonságokkal beprogramozott számítógépes szimulációkhoz hasonló eredményeket ér el.
- Az open-source modellek, mint például a GPT-J, hasonló sikereket mutattak, lehetővé téve a kisebb költségvetésű laboratóriumok számára saját eszközeik fejlesztését.
Miért fontos?
Ez jelentősen csökkenti a kémikusok számára a belépési küszöböt, hogy saját szakterületükön profitáljanak a gépi tanulásból. Ez „demokratizálja” a hozzáférést a hatékony prediktív eszközökhöz azon laboratóriumok számára is, amelyek nem rendelkeznek erőforrásokkal kifinomult, speciális gépi tanulási modellek fejlesztéséhez.