Az OpenAI újra bevezeti az internetes böngészést, és elérhetővé teszi a látási képességeket a ChatGPT-ben

2026. május 23. · MI Történik? · 2 perc olvasás

Az OpenAI jelentős lépést tett a ChatGPT képességeinek bővítésében, hiszen újra elérhetővé tette a webes böngészés funkciót, miközben integrálta a Vision technológiát is a rendszerbe. A böngészés korábbi, júliusi felfüggesztését adatvédelmi és a fizetős tartalmakhoz való jogosulatlan hozzáféréssel kapcsolatos aggályok indokolták, ám a fejlesztők mostanra megoldották ezeket a problémákat. A megújult funkciónak köszönhetően a modell immár képes valós időben keresni az interneten, így a felhasználók a korábbinál sokkal relevánsabb és aktuálisabb válaszokat kaphatnak. Ezzel párhuzamosan a Vision képességek bevezetése alapjaiban változtatja meg a felhasználói interakciót: a ChatGPT mostantól nem csupán szöveges, hanem vizuális inputokat, például képernyőképeket vagy dizájnterveket is képes értelmezni, elemezni, sőt, akár kóddá alakítani.

A Vision technológia megjelenése különösen a fejlesztők és a dizájnerek számára jelent mérföldkövet. A modell bizonyítottan képes komplex SaaS dashboardok képernyőképeit működőképes kóddá konvertálni, de az integráció ennél is tovább megy: a Figma fájlokban megálmodott tervek rövid idő alatt átalakíthatóak React komponensekké, vagy egyetlen feltöltött kép alapján akár percek alatt élő weboldallá formálhatóak. Ez a fajta automatizáció drasztikusan felgyorsíthatja a szoftverfejlesztési folyamatokat, hiszen a vizuális elképzelések és a megvalósult kód közötti idő jelentősen lerövidül. A rendszer rugalmassága és gyorsasága, amellyel kevesebb mint egy perc alatt képes funkcionális webes felületet generálni, új szintre emeli a produktivitást az AI alapú alkalmazásfejlesztés terén.

A technológia jelentősége abban rejlik, hogy a ChatGPT immár egy sokkal komplexebb és önállóbb eszközzé válik a mindennapi munka során. Alapvető fontosságú, hogy a felhasználók tudatosan kérjék a modelltől a webes források ellenőrzését minden fontosabb feladat előtt, ezzel biztosítva, hogy a kapott információk minden esetben naprakészek legyenek. Az új, vizuális képességekkel kiegészülve a ChatGPT egy olyan kreatív és technikai társsá lép elő, amely képes a dizájnok lemásolására és a felhasználói felületek kódolására, így bárki számára elérhetővé teszi azokat a technikai folyamatokat, amelyek korábban komolyabb programozói szaktudást igényeltek. Ez a kettős fejlesztés az OpenAI részéről nem csupán egy technikai frissítés, hanem egy stratégiai irányváltás is, amely az AI-t a passzív kérdezz-felelek funkcióból egy aktív, teremtő és valós idejű problémamegoldó partnerré emeli.

A webes böngészés újbóli bevezetése a valós idejű információk és releváns eredmények biztosítása érdekében
A Vision képességek lehetővé teszik a felhasználók számára, hogy képeket és képernyőképeket tápláljanak be közvetlenül a modellbe
Bizonyított képesség a SaaS dashboardok képernyőképeinek működő kóddá alakítására
Képes a Figma dizájnokat React komponensekké alakítani
Képes egy képet kevesebb mint egy perc alatt élő weboldallá alakítani

Miért fontos?

Alapvető fontosságú, hogy megkérjük a ChatGPT-t, hogy ellenőrizze az internetet, mielőtt bármit is tesz, hogy a válaszai relevánsak maradjanak, az új Vision képességek pedig lehetővé teszik bárki számára, hogy gyakorlatilag lemásoljon felületeket, csupán azáltal, hogy betáplálja őket a modellbe.

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

GPT-5.6 prompting útmutató és új, képernyő-tudatos AI frissítések

8 órája

A HP mesterséges intelligenciája előre jelzi és elhárítja a hardverhibákat

10 órája

AI-ügynökök tanítása szakértői korrekciók alapján

11 órája

Tudj meg többet

OpenAI Sora: AI videógenerálás – minden, amit tudni kell

OpenAI: A ChatGPT mögötti cég – történet, termékek, jövőkép