Megjelent az Opus 4.7, az OpenAI ugyanazon a napon újította meg a Codexe-et
A tegnapi AI naptár két zászlóshajó bevezetésére összpontosult, mindössze néhány óra különbséggel. Ha bármilyen agentic kódolási munkát végzel, a stack-ed épp most frissült. De figyelmeztetés: az az idő, ami alatt eléred a rate limit-edet, valószínűleg szintén rövidült. Az Anthropic kiadása után órákkal… az OpenAI átalakította a Codexe-et, a kódoló appját, hogy „Codex (szinte) mindenre” váljon… azaz az OpenAI Claude Cowork verziója. Mac szintű számítógép-használattal (az ügynökök kattintanak és gépelnek melletted), in-app böngészővel, persistent memory-val, napokon át ébren maradó automatizálásokkal és 90+ új pluginnal (Atlassian Rovo, CircleCI, Microsoft Suite, stb.) érkezik. Sokkal többet is tud ennél. A SaaSpocalypse állása: Mike Krieger, az Anthropic CPO-ja ugyanazon a napon mondott le a Figma igazgatótanácsából, amikor felröppentek a hírek, hogy az Anthropic design szoftvert ad ki. A Figma részvényei estek. A pletykák szerint ez tegnap jelent volna meg… de nem. A web appban most van ez a „adaptív gondolkodás” nevű dolog, ami lehetővé teszi Claude-nak, hogy eldöntse, mennyi ideig gondolkodjon. Más szóval: egy gondolkodó router? Boo! Nos, időbe telik majd „alkalmazkodni” ehhez, de egyelőre használd, mert különben egyáltalán nem fog sokat gondolkodni.
- Az Anthropic az Opus 4.7-et ugyanazzal az 5 dollár / 25 dollár per millió token árazással szállította, mint a 4.6-ot.
- A vizuális érvelés (az, hogy az AI mennyire jól lát) 69,1%-ról 82,1%-ra ugrott, a képek feldolgozása pedig akár 2 576 pixelig is történik a hosszabb oldalon (több mint 3x bármely korábbi Claude-hoz képest).
- A SWE-bench Pro (kódolási benchmark) 53,4%-ról 64,3%-ra emelkedett, és az Opus 4.7 jelenleg az első helyen áll a Vals AI Vibe Code Benchmarkján 71%-kal.
- A buktató, amely az Anthropic saját dokumentációjában rejtőzik: az új tokenizer akár 35%-kal több tokent is használhat ugyanarra a szövegre. A Claude Code új, alapértelmezett xhigh effortjával kombinálva a Pro és Max felhasználók gyorsabban érik el a heti limiteket, hacsak manuálisan nem csökkentik azt.
- Helyezd előtérbe a kontextust: Cél, korlátok és elfogadási kritériumok, mind az első fordulatban. A 4.7 úgy készült, hogy egy teljes briefet vegyen át és azzal dolgozzon.
- Kapcsold be az auto módot: Nyomd meg a Shift+Tab billentyűket a terminálban (Max, Team, Enterprise) a párhuzamos Claude-ok futtatásához felügyelet nélkül.
- Mondd meg neki, hogyan ellenőrizze a saját munkáját: Tedd a tesztelési workflow-dat a claude.md-be, így a 4.7 minden alkalommal futtat teszteket, vagy telepíts egy /verify-app skillt a stack-edhez.
- Az xhigh az új Claude Code alapértelmezett: Használd a /effort-ot a rutinmunka csökkentéséhez; a maximumot a legnehezebb feladatokra tartogasd (ez session-only).
Miért fontos?
Amit olvastunk, az a tokenizer története. Az Anthropic „ugyanaz az árazás, mint a 4.6-nál” technikailag igaz; a gyakorlatban azonban ugyanaz a prompt több tokenre fordítódik, az alapértelmezett effort magasabb, és a kimenet hosszabb. Egy barátunk lényegében egy prompttal elérte a heti Max limitjét. Ennek ellenére az Opus 4.7 egy jobb modell. Ugyanakkor drágább is, még a változatlan listaárak mellett. Azok az emberek, akik a legtöbbet hozzák ki belőle, nem azok lesznek, akik alapértelmezett beállításokkal futtatják. Hanem azok, akik ténylegesen követik a legjobb gyakorlatokat. Tanulmányozd.