MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az OpenAI bemutatta a GPT-4-et multimodális képességekkel és fejlett logikai következtetéssel

Az OpenAI bemutatta a GPT-4 modellt, amely multimodális képességeivel és jelentősen továbbfejlesztett logikai következtetésével új korszakot nyit a mesterséges intelligencia fejlődésében. A technológiai világ által régóta várt GPT-3 utódja nem csupán egy finomhangolt frissítés, hanem egy alapjaiban átgondolt architektúra, amely a ChatGPT hátterében futva már eddig is elképesztő növekedést mutatott fel, két hónap alatt elérve a 100 millió felhasználót. Az új modell legfontosabb újítása a multimodális működés, vagyis az a képesség, hogy a szöveges adatok mellett már a képeket is képes értelmezni és elemezni, miközben jelentősen megnövelt, 25 000 szavas munkamenet-kapacitásával messze túlszárnyalja elődjét, amely mindössze 3 000 szóval tudott egyszerre megbirkózni.

A GPT-4 teljesítménybeli ugrása a gyakorlati teszteken is világosan kirajzolódik, különösen a professzionális szintű logikai feladatok terén. Míg a korábbi verzió, a GPT-3 a jogi szakvizsgán (bar exam) a vizsgázók alsó 10 százalékában végzett, az új modell ugyanezen a teszten a legjobb 10 százalék közé küzdötte fel magát, ami döbbenetes fejlődést mutat az érvelés és az összetett összefüggések átlátása terén. Emellett a modell minden jelentős programozási nyelven képes hatékonyan kódot írni, sőt, a fejlesztők bemutatták, hogy a rendszer akár egy kézzel rajzolt, szalvétára vetett vázlatból is képes teljesen működőképes, kóddal ellátott alkalmazást generálni. Ezek a funkciók már most elérhetőek a ChatGPT Plus előfizetők számára, de az integrációk révén olyan alkalmazásokban is találkozhatunk a technológiával, mint a Duolingo, ahol nyelvi szerepjátékokat támogat, vagy a BeMyEyes, amely a látássérült felhasználók mindennapi vizuális tájékozódását segíti.

Ez a technológiai áttörés azért rendkívül fontos, mert a GPT-4 végleg túllép az egyszerű szövegkiegészítés korlátain, és a multimodális értelmezés, valamint a professzionális szintű logikai érvelés irányába mozdítja el az AI alkalmazások határait. A fejlesztők számára az API hozzáférés várólistás rendszeren keresztül nyílik meg, biztosítva a fokozatos és kontrollált bevezetést. A GPT-4 nem csupán egy technikai mérföldkő, hanem egy olyan eszköz, amely a jogi, kódolási és kreatív szektorban is radikálisan átalakíthatja a munkafolyamatokat, hiszen képes egyszerre kezelni a vizuális információkat és az összetett, szakmai érvelést igénylő feladatokat. Az OpenAI ezzel az új modellel egyértelművé tette, hogy a mesterséges intelligencia fejlesztésében a jövő a sokoldalúságban és a mélyebb logikai képességek integrálásában rejlik.

Miért fontos?

A GPT-4 hatalmas ugrást jelent az AI teljesítményében és hasznosságában; túllép az egyszerű szövegkiegészítésen a multimodális értelmezés és a professzionális szintű logikai érvelés irányába a jogi, kódolási és kreatív feladatok terén. ---

Eredeti forrás megtekintése (angol) →
Kapcsolódó hírek
NYT-újságíró AI segítségével, ingatlanügynök nélkül adta el házát
most
Az Anthropic megerősítette, hogy a nagyteljesítményű Mythos modell hamarosan elérhető lesz a nyilvánosság számára
most
Az ElevenLabs Music v2 lehetővé teszi a szám közbeni műfajváltást és a gyors repet
most
Tudj meg többet
OpenAI Sora: AI videógenerálás – minden, amit tudni kell
OpenAI: A ChatGPT mögötti cég – történet, termékek, jövőkép