A tesztek szerint az OpenAI o3 + Tasks funkciója nem nyújt megbízható valós idejű adatokat

2025. április 22. · MI Történik? · 1 perc olvasás

Bár nagy elvárások övezték az OpenAI o3 modelljének és a ChatGPT Tasks funkciójának együttes használatát a valós idejű monitorozáshoz, a tesztek szerint a megvalósítás jelenleg hibás. Egy kísérletben, amelyben a NASDAQ vállalatok valós idejű részvényárfolyamait kérték le, a modell jelentősen elavult információkat közölt. Bár az o3 kiválóan teljesít webes keresésben egy normál chat során, a 'Tasks' funkció úgy tűnik, nem kényszeríti ki a modellt a lekérdezések újbóli futtatására minden frissítésnél, ami pontatlan eredményekhez vezet időérzékeny adatok esetén.

A valós idejű NASDAQ részvényárfolyamokra vonatkozó tesztek hónapokkal ezelőtti adatokat eredményeztek.
Az o3 nem indít friss webes kereséseket az automatizált feladatok (tasks) futtatása közben.
A jelenlegi implementáció nem biztosítja a pénzügyi vagy élő monitorozáshoz szükséges 'valós idejű' pontosságot.
A felhasználóknak javasolt, hogy ne hagyatkozzanak az o3 + Tasks párosra kritikus valós idejű információk esetén a hiba javításáig.

Miért fontos?

Ez rávilágít a modellek érvelési képességei és az automatizált feladatok végrehajtásához használt infrastruktúra közötti szakadékra, emlékeztetve a felhasználókat, hogy a 'fejlett' modellek továbbra is az alapul szolgáló eszközintegrációk minőségétől függenek. ---

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

Az Anthropic kutatója négy kulcsfontosságú promptstratégiát vázolt fel a Claude Fable 5-höz

most

Az Apple bemutatta a Siri AI funkcióit és az iOS 27-et a WWDC nyitóelőadásán

3 órája

A NASA X-59-es repülőgépe elérte a szuperszonikus sebességet, ami jelentős mérföldkő a repülésben

5 órája

Tudj meg többet

OpenAI Sora: AI videógenerálás – minden, amit tudni kell

OpenAI: A ChatGPT mögötti cég – történet, termékek, jövőkép