A Microsoft megjelentette a Phi-3 nagy teljesítményű kis nyelvi modelleket

2026. május 23. · MI Történik? · 2 perc olvasás

A Microsoft legújabb bejelentése komoly mérföldkövet jelent a mesterséges intelligencia fejlődésében, ugyanis a tech óriás hivatalosan is megjelentette a Phi-3 nagy teljesítményű kis nyelvi modellek új családját. Az AI iparágban eddig a minél nagyobb méretű LLM fejlesztések domináltak, ám a Microsoft most bebizonyította, hogy a kevesebb néha több. A Phi-3 modellek ugyanis nemcsak új benchmark mérföldköveket értek el a kisebb méretű AI kategóriában, hanem bizonyos területeken képesek felülteljesíteni a jóval nagyobb méretű riválisaikat is. Ez a lépés alapjaiban változtathatja meg azt, hogyan gondolkodunk az algoritmusok hatékonyságáról és elérhetőségéről.

A frissen bemutatott Phi-3 modellcsalád három különböző méretben érkezik, hogy a legkülönbözőbb felhasználási igényeknek is megfeleljen. A család legkisebb tagja a Phi-3-mini, amely mindössze 3.8B paraméterrel rendelkezik, a következő lépcsőfokot a 7B paraméteres Phi-3-small jelenti, a legerősebb változat pedig a Phi-3-medium lesz a maga 14B paraméterével. A legnagyobb meglepetést egyértelműen a Phi-3-mini okozta, amelynek benchmark eredményei közvetlenül a Mixtral-lal és a GPT 3.5-tel vetekednek. Ez a rendkívüli teljesítmény annak ellenére valósult meg, hogy a modell lényegesen kisebb a versenytársainál, ráadásul egy megdöbbentően nagy, 128k-s context window-val látták el, ami kivételes szövegértési kapacitást biztosít számára.

A Phi-3-mini kompakt, 3.8B paraméteres mérete egy olyan egyedülálló technológiai előnyt hordoz magában, amely lehetővé teszi a modell közvetlen, eszközön történő futtatását is. Ez azt jelenti, hogy a felhasználóknak nem feltétlenül kell felhőalapú infrastruktúrára vagy méregdrága GPU erőforrásokra támaszkodniuk, miközben a rendszer teljes mértékben megőrzi a prémium minőséget és a kiváló költséghatékonyságot. Miközben a Mini verzió már most lenyűgözi a piacot, a nagyobb testvérei, vagyis a 7B Phi-3-small és a 14B Phi-3-medium még jelenleg is tanítás alatt állnak. A Microsoft tájékoztatása szerint a fejlesztési munkálatok a menetrend szerint haladnak, így ezek a robusztusabb verziók a következő hetekben válnak majd széles körben elérhetővé.

De miért is számít ez a bejelentés valódi technológiai áttörésnek az AI világában? A Microsoft ezzel a lépéssel egyértelműen megmutatja a piac számára, hogy a megfelelő tanítási adatokkal és a precízen optimalizált technikákkal a kis nyelvi modellek is képesek jóval a saját súlycsoportjuk felett teljesíteni. Nem szükséges gigantikus infrastruktúra ahhoz, hogy élvonalbeli eredményeket érjünk el. Különösen a Phi-3-mini képességei jelentenek hatalmas előrelépést, hiszen ez a modell megnyitja az utat a nagy teljesítményű modellek előtt, hogy hatékonyan és gyorsan fussanak akár a mindennapi használatban lévő telefonjainkon is, forradalmasítva a mobilis intelligenciát.

A Phi-3 modellcsalád három méretben érkezik: a Phi-3-mini 3.8B paraméterrel, a Phi-3-small 7B paraméterrel, és a Phi-3-medium 14B paraméterrel.
A Phi-3-mini benchmark eredményei a Mixtral-lal és a GPT 3.5-tel vetekednek, annak ellenére, hogy lényegesen kisebb, ráadásul megdöbbentő, 128k-s context window-val rendelkezik.
A Mini 3.8B paraméteres mérete lehetővé teszi a modell eszközön történő futtatását is, miközben megőrzi a minőséget és a költséghatékonyságot.
A 7B Phi-3-small és a 14B Phi-3-medium még tanítás alatt áll, és a következő hetekben válnak elérhetővé.

Miért fontos?

A Microsoft megmutatja, hogy a megfelelő tanítási adatokkal és technikákkal a kis nyelvi modellek jóval a súlycsoportjuk felett képesek teljesíteni. Különösen a Phi-3-mini képességei jelentenek hatalmas áttörést – megnyitva az utat a nagy teljesítményű modellek előtt, hogy hatékonyan fussanak a telefonjainkon. ---

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

Az IBM vezérigazgatója szerint az AI-infrastruktúra kiépítése hátrányosan érinti a vállalati szoftvereladásokat

19 órája

Az OpenAI hordozható, okos AI-hangszórót dobna piacra

1 napja

A PrismML bemutatta az eddigi legnagyobb, iPhone-on futtatható AI-modellt

1 napja

Tudj meg többet

Microsoft Copilot: Teljes útmutató magyarul (2026)

Nagy nyelvi modellek (LLM): Hogyan működnek a ChatGPT-féle rendszerek?