SALESFORCE
A Salesforce APIGen-je lehetővé tette a „Tiny Giant” xLAM modell áttörését
Az összefoglaló: A Salesforce nemrégiben új kutatást tett közzé az APIGen-ről, egy automatizált rendszerről, amely optimális adatkészleteket generál az AI oktatásához függvényhívási (function calling) feladatokon — lehetővé téve a vállalat xLAM modellje számára, hogy felülmúlja sokkal nagyobb riválisait.
- Az APIGen-t arra tervezték, hogy segítse a modellek tanítását olyan adatkészleteken, amelyek jobban tükrözik az API-használat valós összetettségét.
- A Salesforce az APIGen segítségével az xLAM 7B és 1B paraméteres verzióját is betanította, tesztelve őket a legfontosabb függvényhívási benchmarkokon.
- Az xLAM 7B paraméteres modellje 46 modell közül a 6. helyen végzett, beérve vagy megelőzve a nála tízszer nagyobb riválisokat — beleértve a GPT-4-et is.
- Az xLAM 1B „Tiny Giant” felülmúlta az olyan modelleket, mint a Claude Haiku és a GPT-3.5, Marc Benioff vezérigazgató pedig a legjobb függvényhívó „mikro-modellnek” nevezte.
Miért fontos?
Miközben az AI verseny az egyre nagyobb modellek építésére fókuszált, a Salesforce megközelítése azt sugallja, hogy az okosabb adatkezelés hatékonyabb rendszerekhez vezethet. A kutatás egyben jelentős lépés a jobb eszközön futó, ágens-alapú AI felé — egy apró keretbe sűrítve a nagy modellek erejét.