A finomhangolt LLM-ek felveszik a versenyt a specializált modellekkel a kémiai tulajdonságok előrejelzésében

2024. február 7. · MI Történik? · 1 perc olvasás

Számítógépes kémikusok bebizonyították, hogy az általános célú nagy nyelvi modellek (LLM-ek) meglepően alkalmassá tehetők kémiai kutatási kérdések megválaszolására. Az olyan rendszerek minimális adattal történő finomhangolásával, mint a GPT-3, a modellek képesek elérni vagy akár meg is haladni a specializált eszközök teljesítményét a molekuláris tulajdonságok vagy a reakcióhozamok előrejelzése során.

A kutatók kémiai vegyületekről szóló szakirodalmat gyűjtöttek össze, és az adatokat nagyjából 30 kérdés-felelet párrá alakították a finomhangoláshoz.
A rendszer sikeresen jósolta meg olyan „ismeretlen” anyagok és ötvözetek tulajdonságait, amelyek nem szerepeltek az eredeti tanítókészletben.
A technika kizárólag kémiai képleteket használ, és a fizikai tulajdonságokkal beprogramozott számítógépes szimulációkhoz hasonló eredményeket ér el.
Az open-source modellek, mint például a GPT-J, hasonló sikereket mutattak, lehetővé téve a kisebb költségvetésű laboratóriumok számára saját eszközeik fejlesztését.

Miért fontos?

Ez jelentősen csökkenti a kémikusok számára a belépési küszöböt, hogy saját szakterületükön profitáljanak a gépi tanulásból. Ez „demokratizálja” a hozzáférést a hatékony prediktív eszközökhöz azon laboratóriumok számára is, amelyek nem rendelkeznek erőforrásokkal kifinomult, speciális gépi tanulási modellek fejlesztéséhez.

Eredeti forrás megtekintése (angol) →