Kutatók arra tanítják az LLM-eket, hogy felismerjék, mikor van szükségük külső tanácsra
A mesterséges intelligencia iparágának egyik legnagyobb jelenlegi kihívása, hogy a nagy nyelvi modellek (LLM) hajlamosak magabiztosan téves információkat adni, ha nem rendelkeznek a pontos adatokkal. A University of California San Diego és a Tsinghua University kutatói azonban most egy olyan áttörést értek el ezen a területen, amely alapjaiban változtathatja meg a rendszerek megbízhatóságát. A szakemberek sikeresen megtanították az LLM-eknek, hogy felismerjék a saját belső tudásbeli hiányosságaikat, és pontosan azonosítsák azokat a helyzeteket, amikor külső tanácsra van szükségük ahelyett, hogy kizárólag a saját belső tudásbázisukra hagyatkoznának.
A kutatócsoport a módszer kidolgozásakor egy rendkívül kézenfekvő, mégis hatékony forráshoz fordult inspirációért: az emberi problémamegoldó folyamatokat vették alapul. Amikor az emberek egy összetett feladattal szembesülnek, és felismerik, hogy a meglévő ismereteik nem elegendőek a helyes megoldáshoz, természetes módon külső forrásokhoz, adatokhoz vagy más szakértők tanácsaihoz folyamodnak. Ezt az emberi viselkedést és döntési mechanizmust sikerült most átültetni az AI rendszerekbe. Az új eljárásnak köszönhetően a modellek képessé válnak arra, hogy felismerjék saját kompetenciájuk határait, és tudatosítsák, ha külső segítség bevonása szükséges.
Az elért kutatási eredmények rendkívül látványosak, és komoly fejlődést hozhatnak a technológiai piacon. A bevezetett módszer alkalmazásával a modellek pontossága átlagosan 28 százalékkal növekedett a standard verziókhoz kpest. Ez a drasztikus növekedés azt eredményezte, hogy a kutatók által fejlesztett megközelítés teljesítményben közvetlenül felülmúlta a jelenlegi piacvezető top modelleket is. A tesztek során a rendszer sikeresen lekörözte az iparági etalonnak számító GPT-4o-t, valamint a Claude 3.5 modellt is. Ez az előrelépés jól mutatja, hogy a jövő útja a belső hiányosságok intelligens felismerésében rejlik.
- A módszer lehetővé teszi az LLM-ek számára a belső tudásbeli hiányosságok felismerését
- Az emberi problémamegoldó folyamatok inspirálták
- A pontosság 28%-kal nőtt a standard modellekhez képest
- Teljesítményben felülmúlta a top modelleket, mint a GPT-4o és a Claude 3.5
- --