VÉLEMÉNYÜNK
A tesztek szerint az OpenAI o3 + Tasks funkciója nem nyújt megbízható valós idejű adatokat
Bár nagy elvárások övezték az OpenAI o3 modelljének és a ChatGPT Tasks funkciójának együttes használatát a valós idejű monitorozáshoz, a tesztek szerint a megvalósítás jelenleg hibás. Egy kísérletben, amelyben a NASDAQ vállalatok valós idejű részvényárfolyamait kérték le, a modell jelentősen elavult információkat közölt. Bár az o3 kiválóan teljesít webes keresésben egy normál chat során, a 'Tasks' funkció úgy tűnik, nem kényszeríti ki a modellt a lekérdezések újbóli futtatására minden frissítésnél, ami pontatlan eredményekhez vezet időérzékeny adatok esetén.
- A valós idejű NASDAQ részvényárfolyamokra vonatkozó tesztek hónapokkal ezelőtti adatokat eredményeztek.
- Az o3 nem indít friss webes kereséseket az automatizált feladatok (tasks) futtatása közben.
- A jelenlegi implementáció nem biztosítja a pénzügyi vagy élő monitorozáshoz szükséges 'valós idejű' pontosságot.
- A felhasználóknak javasolt, hogy ne hagyatkozzanak az o3 + Tasks párosra kritikus valós idejű információk esetén a hiba javításáig.
Miért fontos?
Ez rávilágít a modellek érvelési képességei és az automatizált feladatok végrehajtásához használt infrastruktúra közötti szakadékra, emlékeztetve a felhasználókat, hogy a 'fejlett' modellek továbbra is az alapul szolgáló eszközintegrációk minőségétől függenek. ---