AI KUTATÁS
A diffúziós nyelvmodellek célja az AI tízszeres gyorsítása és olcsóbbá tétele
Stefano Ermon, az Inception Labs munkatársa azt vizsgálja, hogyan forradalmasíthatják a diffúziós nyelvmodellek (DLM-ek) a szöveggenerálás sebességét és költségeit. A jelenlegi Large Language Modellek (LLM-ek) futtatása lassú és drága lehet, de a DLM-ek – amelyek a Midjourney-hez hasonló képgeneráló eszközök elveit alkalmazzák a szövegre – potenciálisan tízszer gyorsabbá tehetik az AI-t. A kutatás fókuszában a tokenköltségek egymillió tokenenkénti 0,25 dollárra való leszorítása áll, a kiváló minőség megőrzése mellett.
- A szöveges diffúziós modellek másképp működnek, mint a standard autoregresszív LLM-ek, ami gyorsabb generálást tesz lehetővé.
- Ez a megközelítés jelentősen csökkentheti a komplex AI érvelési feladatokhoz jelenleg társuló késleltetést (latency).
- Az Inception Labs 0,25 dolláros árat céloz meg egymillió tokenenként, hogy a nagy léptékű AI alkalmazások életképesebbé váljanak.
Miért fontos?
Miért fontos: Ha az AI modellek tízszer gyorsabbá és jelentősen olcsóbbá válnak, az megnyitja az utat a valós idejű, nagy gyakoriságú AI interakciók előtt, amelyek jelenleg túl drágák vagy lassúak a megvalósításhoz. ---