MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az OpenAI újra bevezeti az internetes böngészést, és elérhetővé teszi a látási képességeket a ChatGPT-ben

Az OpenAI jelentős lépést tett a ChatGPT képességeinek bővítésében, hiszen újra elérhetővé tette a webes böngészés funkciót, miközben integrálta a Vision technológiát is a rendszerbe. A böngészés korábbi, júliusi felfüggesztését adatvédelmi és a fizetős tartalmakhoz való jogosulatlan hozzáféréssel kapcsolatos aggályok indokolták, ám a fejlesztők mostanra megoldották ezeket a problémákat. A megújult funkciónak köszönhetően a modell immár képes valós időben keresni az interneten, így a felhasználók a korábbinál sokkal relevánsabb és aktuálisabb válaszokat kaphatnak. Ezzel párhuzamosan a Vision képességek bevezetése alapjaiban változtatja meg a felhasználói interakciót: a ChatGPT mostantól nem csupán szöveges, hanem vizuális inputokat, például képernyőképeket vagy dizájnterveket is képes értelmezni, elemezni, sőt, akár kóddá alakítani.

A Vision technológia megjelenése különösen a fejlesztők és a dizájnerek számára jelent mérföldkövet. A modell bizonyítottan képes komplex SaaS dashboardok képernyőképeit működőképes kóddá konvertálni, de az integráció ennél is tovább megy: a Figma fájlokban megálmodott tervek rövid idő alatt átalakíthatóak React komponensekké, vagy egyetlen feltöltött kép alapján akár percek alatt élő weboldallá formálhatóak. Ez a fajta automatizáció drasztikusan felgyorsíthatja a szoftverfejlesztési folyamatokat, hiszen a vizuális elképzelések és a megvalósult kód közötti idő jelentősen lerövidül. A rendszer rugalmassága és gyorsasága, amellyel kevesebb mint egy perc alatt képes funkcionális webes felületet generálni, új szintre emeli a produktivitást az AI alapú alkalmazásfejlesztés terén.

A technológia jelentősége abban rejlik, hogy a ChatGPT immár egy sokkal komplexebb és önállóbb eszközzé válik a mindennapi munka során. Alapvető fontosságú, hogy a felhasználók tudatosan kérjék a modelltől a webes források ellenőrzését minden fontosabb feladat előtt, ezzel biztosítva, hogy a kapott információk minden esetben naprakészek legyenek. Az új, vizuális képességekkel kiegészülve a ChatGPT egy olyan kreatív és technikai társsá lép elő, amely képes a dizájnok lemásolására és a felhasználói felületek kódolására, így bárki számára elérhetővé teszi azokat a technikai folyamatokat, amelyek korábban komolyabb programozói szaktudást igényeltek. Ez a kettős fejlesztés az OpenAI részéről nem csupán egy technikai frissítés, hanem egy stratégiai irányváltás is, amely az AI-t a passzív kérdezz-felelek funkcióból egy aktív, teremtő és valós idejű problémamegoldó partnerré emeli.

Miért fontos?

Alapvető fontosságú, hogy megkérjük a ChatGPT-t, hogy ellenőrizze az internetet, mielőtt bármit is tesz, hogy a válaszai relevánsak maradjanak, az új Vision képességek pedig lehetővé teszik bárki számára, hogy gyakorlatilag lemásoljon felületeket, csupán azáltal, hogy betáplálja őket a modellbe.

Eredeti forrás megtekintése (angol) →
Kapcsolódó hírek
NYT-újságíró AI segítségével, ingatlanügynök nélkül adta el házát
most
Az Anthropic megerősítette, hogy a nagyteljesítményű Mythos modell hamarosan elérhető lesz a nyilvánosság számára
most
Az ElevenLabs Music v2 lehetővé teszi a szám közbeni műfajváltást és a gyors repet
most
Tudj meg többet
OpenAI Sora: AI videógenerálás – minden, amit tudni kell
OpenAI: A ChatGPT mögötti cég – történet, termékek, jövőkép