A Salesforce APIGen-je lehetővé tette a „Tiny Giant” xLAM modell áttörését

SALESFORCE

A Salesforce APIGen-je lehetővé tette a „Tiny Giant” xLAM modell áttörését

2024. július 4. · MI Történik? · 1 perc olvasás

Az összefoglaló: A Salesforce nemrégiben új kutatást tett közzé az APIGen-ről, egy automatizált rendszerről, amely optimális adatkészleteket generál az AI oktatásához függvényhívási (function calling) feladatokon — lehetővé téve a vállalat xLAM modellje számára, hogy felülmúlja sokkal nagyobb riválisait.

Az APIGen-t arra tervezték, hogy segítse a modellek tanítását olyan adatkészleteken, amelyek jobban tükrözik az API-használat valós összetettségét.
A Salesforce az APIGen segítségével az xLAM 7B és 1B paraméteres verzióját is betanította, tesztelve őket a legfontosabb függvényhívási benchmarkokon.
Az xLAM 7B paraméteres modellje 46 modell közül a 6. helyen végzett, beérve vagy megelőzve a nála tízszer nagyobb riválisokat — beleértve a GPT-4-et is.
Az xLAM 1B „Tiny Giant” felülmúlta az olyan modelleket, mint a Claude Haiku és a GPT-3.5, Marc Benioff vezérigazgató pedig a legjobb függvényhívó „mikro-modellnek” nevezte.

Miért fontos?

Miközben az AI verseny az egyre nagyobb modellek építésére fókuszált, a Salesforce megközelítése azt sugallja, hogy az okosabb adatkezelés hatékonyabb rendszerekhez vezethet. A kutatás egyben jelentős lépés a jobb eszközön futó, ágens-alapú AI felé — egy apró keretbe sűrítve a nagy modellek erejét.

Eredeti forrás megtekintése (angol) →