A tesztelés jelentős korlátokat tárt fel az o3 és a ChatGPT Tasks integrációjában

2025. április 22. · MI Történik? · 1 perc olvasás

Annak ellenére, hogy az o3 állítólag használható a ChatGPT Tasks funkciójával a valós idejű frissítésekhez, a jelenlegi tesztek szerint a megvalósítás még nem megbízható. Egy kísérletben, amelyben NASDAQ cégek valós idejű részvényárait kérték le, az eredmények több hónappal ezelőtti adatokat mutattak. Bár az o3 kiválóan keres a weben az aktív chat-folyamatok során, úgy tűnik, a háttérben futó feladatok (Tasks) frissítésekor nem végez következetesen új kereséseket, ami hibás adatokhoz vezet.

A $FAST és $BKNG részvényekre vonatkozó tesztek olyan árakat adtak vissza, amelyek az elmúlt 6 hónapban nem voltak láthatók.
A feladatkezelő rendszer nem aktiválta az o3 webes keresőeszközét minden ütemezett frissítésnél.
A felhasználóknak javasoljuk, hogy egyelőre ne hagyatkozzanak az „o3 + Tasks” kombinációra valós idejű vagy időérzékeny információk esetén.

Miért fontos?

Ez rávilágít az AI képességek „egyenetlen fejlődési határvonalára” (jagged frontier) – ahol egy modell zseniális lehet a beszélgetésben, de kudarcot vallhat az egyszerű automatizált háttérfeladatokban. ---

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

Az Anthropic kutatója négy kulcsfontosságú promptstratégiát vázolt fel a Claude Fable 5-höz

most

Az Apple bemutatta a Siri AI funkcióit és az iOS 27-et a WWDC nyitóelőadásán

3 órája

A NASA X-59-es repülőgépe elérte a szuperszonikus sebességet, ami jelentős mérföldkő a repülésben

5 órája

Tudj meg többet

ChatGPT vs Claude vs Gemini - Melyiket válaszd 2026-ban?

ChatGPT használata a munkában: Gyakorlati útmutató irodai dolgozóknak