VÉLEMÉNYÜNK A...
A tesztelés jelentős korlátokat tárt fel az o3 és a ChatGPT Tasks integrációjában
Annak ellenére, hogy az o3 állítólag használható a ChatGPT Tasks funkciójával a valós idejű frissítésekhez, a jelenlegi tesztek szerint a megvalósítás még nem megbízható. Egy kísérletben, amelyben NASDAQ cégek valós idejű részvényárait kérték le, az eredmények több hónappal ezelőtti adatokat mutattak. Bár az o3 kiválóan keres a weben az aktív chat-folyamatok során, úgy tűnik, a háttérben futó feladatok (Tasks) frissítésekor nem végez következetesen új kereséseket, ami hibás adatokhoz vezet.
- A $FAST és $BKNG részvényekre vonatkozó tesztek olyan árakat adtak vissza, amelyek az elmúlt 6 hónapban nem voltak láthatók.
- A feladatkezelő rendszer nem aktiválta az o3 webes keresőeszközét minden ütemezett frissítésnél.
- A felhasználóknak javasoljuk, hogy egyelőre ne hagyatkozzanak az „o3 + Tasks” kombinációra valós idejű vagy időérzékeny információk esetén.
Miért fontos?
Ez rávilágít az AI képességek „egyenetlen fejlődési határvonalára” (jagged frontier) – ahol egy modell zseniális lehet a beszélgetésben, de kudarcot vallhat az egyszerű automatizált háttérfeladatokban. ---