Mikor jelent meg a Claude Opus 4.8?

A Claude Opus 4.8-at az Anthropic 2026. május 28-án, csütörtökön jelentette be és tette elérhetővé. A modell még aznap elérhető lett a claude.ai felületen, a Claude API-n, az Amazon Bedrock-on, a Google Vertex AI-on, valamint a GitHub Copilot, a Cursor és a Microsoft Foundry integrációkban.

Mennyibe kerül a Claude Opus 4.8?

A normál árazás változatlan az Opus 4.7-hez képest: 5 dollár per millió input token és 25 dollár per millió output token. A Fast Mode ára 10 dollár per millió input és 50 dollár per millió output token, de cserébe 2,5× gyorsabb és az Anthropic szerint 3× olcsóbb a korábbi gyors módoknál.

Mi a különbség a Claude Opus 4.7 és 4.8 között?

Három fő különbség. Egy: a 4.8 az Anthropic szerint 4× kisebb valószínűséggel hagy benne észrevétlen hibát abban a kódban, amit ő maga írt. Kettő: új funkciók — Effort Control (a felhasználó dönti el a gondolkodási intenzitást), Dynamic Workflows (több száz párhuzamos alügynök Claude Code-ban), valamint a Messages API mid-task system instruction támogatása. Három: a sajtóbeszámolók szerint a SWE-Bench Pro benchmarkon 64,3%-ról 69,2%-ra javult.

Hogyan használhatja egy magyar KKV a Claude Opus 4.8-at?

Öt fő use case javasolt. (1) Kódellenőrzés és code review automatizáció fejlesztő csapatoknak. (2) Customer support első szintű triage chatbot Fast Mode-ban. (3) Pénzügyi bizonylat-kategorizálás Dynamic Workflows-val, párhuzamos feldolgozással. (4) SEO termékleírás és tartalomgyártás webshopoknak. (5) Computer use alapú versenytárs-monitoring és piackutatás. Bevezetés: 3-5 nap A/B teszt, 1 nap model ID csere, 1-2 hét Effort Control rétegezés, 1 hónap fokozatos éles átállás.

Claude Opus 4.8: új Anthropic flagship

Mi a Claude Opus 4.8 és mi újdonság benne magyar KKV számára? A Claude Opus 4.8 az Anthropic 2026. május 28-án bejelentett új flagship AI modellje, amely az agentikus kódolásban, a hosszú futású feladatokban és a megbízhatóságban hoz célzott finomítást a Claude Opus 4.7-hez képest — változatlan árazással (5 dollár / millió input token, 25 dollár / millió output token) és új Fast Mode-dal, ami 2,5× gyorsabb és 3× olcsóbb a korábbi gyors módoknál. A három legfontosabb új funkció: Effort Control (a felhasználó dönti el, mennyit gondolkodjon a modell — High, xHigh, Max szintek), Dynamic Workflows (több száz párhuzamos alügynök Claude Code-ban) és a frissített Messages API, ami menet közben enged új rendszerinstrukciókat a prompt cache megőrzése mellett. Az Anthropic szerint a 4.8 négyszer kisebb arányban hagy saját kódjában észrevétlen hibát, mint az elődje. Magyar KKV-knak ez azt jelenti, hogy az ügyfélszolgálati automatizáció, a könyvelési kategorizálás, a kódellenőrzés és a piackutatás olcsóbb, gyorsabb és kevésbé hibás lesz — miközben nem kell új szerződést kötni vagy költségvetést átstrukturálni.

Csütörtök reggel arra ébredtem, hogy a Slack-em tele van linkekkel: az Anthropic bejelentette a Claude Opus 4.8-at. A modell ugyanazon a napon, 2026. május 28-án elérhetővé vált a claude.ai felületen, az API-n, az Amazon Bedrock-on, a Google Vertex AI-on, valamint a GitHub Copilot, a Cursor és a Microsoft Foundry rendszerein keresztül. Az Anthropic ezzel a modellel pozícionálja magát az OpenAI GPT-5.5 és a Google Gemini 3.1 Pro közvetlen versenytársaként — egy olyan időszakban, amikor a sajtó szerint a két óriáscég IPO-versenyt fut egymással.

De mi van a marketing-zaj mögött? Mit kap egy magyar mikro-, kis- vagy középvállalkozás abból, hogy az Anthropic ráadott még egy decimális pontot a modellnevére? A cikkben végigvesszük a technikai részleteket, az árazást, a benchmark eredményeket és — ami a legfontosabb — öt konkrét magyar KKV use case-t. Az adatokat a hivatalos Anthropic bejelentésből, a 9to5Mac, a 9to5Google, a MacRumors, a Yahoo Finance, a BeInCrypto és a HandyAI független beszámolóiból állítottam össze, mindegyiket WebFetch-csel ellenőriztem.

Mit jelentett be az Anthropic 2026. május 28-án?

A bejelentés három fő üzenetre épült. Először: a Claude Opus 4.8 a vállalat új flagship modellje, amely felváltja a tavasszal kiadott Opus 4.7-et. Másodszor: a fókusz az agentikus kódoláson és a hosszú futású feladatokon van — vagyis azokon a forgatókönyveken, amikor a modell nem egy kérdést válaszol meg, hanem önállóan végigvisz egy összetett munkafolyamatot. Harmadszor: a modell „more honest" — vagyis az Anthropic hivatalos állítása szerint az elődjéhez képest négyszer kisebb arányban hagy saját kódjában észrevétlen hibát.

Idézve az Anthropic hivatalos blogjáról: „around four times less likely than its predecessor to allow flaws in code it has written to pass unremarked." Magyarul: négyszer kisebb az esélye annak, hogy a modell a saját kódjában meghúzódó hibát szó nélkül átengedi. Ez nem egy benchmark szám — ez egy alkalmazott megbízhatósági állítás, ami közvetlenül érinti azokat a KKV-kat, ahol nem ül egy senior fejlesztő minden AI-output mellett.

A Yahoo Finance az ipari kontextust is megadta: „This new iteration serves as an enhancement over the company's previous leading model, Opus 4.7." Vagyis nem teljes architekturális ugrás történt, hanem célzott finomítás — ami egyébként pontosan azt jelenti, amit egy működő üzleti felhasználónak akarni kell: kevesebb meglepetést, több stabilitást.

Technikai részletek: model ID, kontextus, effort control

Aki API-n keresztül használja a modellt, annak a legfontosabb azonosító a claude-opus-4-8 model ID. Ez kerül a request body-ba, és ez fog megjelenni a számlán. A modell elérhető a claude.ai felületen (a felhasználói előfizetésnek megfelelően), a közvetlen Anthropic Claude API-n, az Amazon Bedrock és a Google Vertex AI integrációkon keresztül, valamint a GitHub Copilot, a Cursor IDE és a Microsoft Foundry partnercsatornákon.

A legizgalmasabb új beállítás az Effort Control. A Yahoo Finance megfogalmazásában: „Users will now have the ability to adjust how much effort Claude expends on various tasks." A claude.ai felületen három szint áll rendelkezésre: High (alapértelmezett), xHigh és Max. Minél magasabb a szint, annál mélyebben gondolkodik a modell — több belső reasoning lépést tesz meg, mielőtt válaszol. Aki használta már a Claude Code Routines háttéragent használat patternt, az pontosan tudja, miért fontos ez: vannak feladatok, ahol a sebesség számít (rövid összefoglaló, kategorizálás), és vannak, ahol a mélység (architektúra-tervezés, hosszú szöveg refaktorálása).

A KKV-szempontból gyakorlatias üzenet: ugyanazért a token-árért most már szabályozható a minőség-sebesség kompromisszum. Aki napi 200 ügyfélkérdést válaszoltat meg a modellel, az High módban hagyja. Aki egy 30 oldalas üzleti tervet készít, az átállítja Max módba — és elfogad egy hosszabb válaszidőt cserébe a jobb gondolkodásért.

Új funkciók részletesen: Dynamic Workflows, Messages API, Effort Control

Dynamic Workflows — több száz párhuzamos alügynök

A Claude Code felületen érkezett a research preview-ben elérhető Dynamic Workflows funkció. A leírás szerint a modell képes „hundreds of parallel subagents" futtatására egyetlen nagy feladaton belül. Ez gyakorlatban azt jelenti: ha kiadsz egy parancsot, hogy „auditáld a teljes kódrepót és gyűjtsd ki a biztonsági kockázatokat", akkor a modell több tucat (vagy több száz) párhuzamos alügynököt indít — minden alügynök egy-egy fájlt vagy modult vizsgál, majd az eredményt összesíti egy gazda ügynök.

Ez a koncepció rokon azzal a megközelítéssel, amit korábban az Anthropic always-on agentek (Conway) kapcsán ismertettünk. A különbség: a Conway megközelítés a folyamatos, hosszú futású ügynök architektúrára épült, a Dynamic Workflows pedig az ad-hoc, feladat-specifikus orchestrációra. Magyar KKV-nak akkor érdekes, ha van egy ismétlődő, sok-fájlos, párhuzamosítható feladata — például könyvelési bizonylatok kategorizálása, vagy 500 termékleírás SEO-felülvizsgálata.

Messages API mid-task system instruction

A fejlesztők számára a másik fontos újdonság a Messages API frissítése. A 9to5Mac megfogalmazásában: „The Messages API now accepts system entries inside the messages array." Eddig a rendszer-instrukciókat egy külön top-level mezőben kellett megadni, és a beszélgetés indulása után már nem lehetett változtatni rajtuk anélkül, hogy a prompt cache érvénytelenné vált volna.

Mostantól a messages tömbön belül is elhelyezhetők rendszer-bejegyzések — vagyis menet közben, futás közben adhatsz a modellnek új viselkedési instrukciót anélkül, hogy elveszítenéd a cache-elt token-előzményt. Ez konkrét cache-megtakarítást jelent: egy hosszú ügyfélszolgálati beszélgetésben, ha a 12. üzenetnél átvált az ügynök egy másik osztály profiljára, nem kell újra felépíteni a teljes promptot.

Effort Control mint termékdöntés

Az Effort Control nem csak technikai feature — termékstratégiai üzenet is. Az Anthropic ezzel kimondja: a saját agentikus pipeline-od az, amit te szabályozol, nem a modell hozza meg helyetted a döntést, hogy mennyit gondolkodjon. Ez ellentétes irány azzal, amit a versenytársak (különösen az OpenAI o-széria) korábban követtek, ahol a „reasoning budget" gyakran fix vagy automatikus volt.

Árazás: változatlan normál ár, kedvező Fast Mode

A leglényegesebb üzleti hír talán az, ami nem változott: a normál árazás. A standard token-árak 1:1 ugyanazok, mint az Opus 4.7-nél voltak. Ez azt jelenti, hogy aki most ül egy folyamatban lévő Opus 4.7-es integráción, az egyetlen model ID csere árán átlépheti a 4.8-as modellt, anélkül hogy újra kellene tárgyalni a belső költségvetést vagy frissíteni a TCO kalkulációt.

Mód	Input ár (1M token)	Output ár (1M token)	Sebesség
Claude Opus 4.8 — normál	5 USD	25 USD	standard latencia
Claude Opus 4.8 — Fast Mode	10 USD	50 USD	2,5× gyorsabb
Claude Opus 4.7 — normál (összehasonlítás)	5 USD	25 USD	standard latencia

A Fast Mode önmagában nem új koncepció — az OpenAI és a Google is kínál hasonló prémium-sebesség opciókat. Az új viszont az, hogy az Anthropic állítása szerint az Opus 4.8 Fast Mode-ja háromszor olcsóbb, mint a korábbi gyors módok voltak, miközben 2,5× gyorsabb a normál módnál. Ez a fajta árazás közvetlenül a magas-volumenű, latencia-érzékeny használati esetekre céloz: chatbot, live customer support, voice agent backend.

Érdemes ezt a hírt összerakni a tágabb tőkepiaci kontextussal. Az Anthropic 900 milliárd dolláros valuáció kontextusban a vállalat egyértelműen vállalja a magasabb infrastruktúra-költségeket azzal a céllal, hogy ne kelljen a végfelhasználói áron ezt áthárítani. Magyar KKV-nak ez stabilitást jelent: nem kell rövid távon árrobbanástól tartani.

Claude Opus 4.8 benchmark összehasonlító infografika — SWE-Bench Pro programozási teszt eredménye: Opus 4.7 64,3%, Opus 4.8 69,2%, GPT-5.5 58,6%, magyar feliratokkal — Sajtóbeszámolók szerinti SWE-Bench Pro eredmények: Claude Opus 4.7 vs 4.8 vs GPT-5.5.

Benchmark eredmények: SWE-Bench Pro, OSWorld, honesty metric

A hivatalos Anthropic blog két konkrét számot emel ki. Az első a már említett 4× honesty javulás: a modell az elődjéhez képest négyszer kisebb valószínűséggel hagy benne észrevétlen hibát abban a kódban, amit ő maga írt. A második az Online-Mind2Web 84%-os eredménye — ez egy computer-use benchmark, amely a modell webes felületeken való önálló cselekvési képességét méri.

A sajtóbeszámolók szerint az Opus 4.8 a SWE-Bench Pro programozási benchmarkon 69,2%-os eredményt ért el, szemben az Opus 4.7 64,3%-ával és a sajtó által hivatkozott GPT-5.5 58,6%-ával. Ezeket a számokat az Anthropic hivatalos blogján közvetlenül nem találtam meg ilyen formában, így óvatosan kezelendők — de több független sajtóforrás megerősíti őket. Aki a részletes versenyt szeretné elemezni, az érdemes összevetnie a Claude Opus 4.7 benchmark eredményei cikkünkkel, mert ott a teljes módszertan dokumentálva van.

Benchmark	Opus 4.7	Opus 4.8	Megjegyzés
SWE-Bench Pro (sajtó szerint)	64,3%	69,2%	kódolási feladat
Online-Mind2Web	n. a. (publikus)	84%	computer-use (Anthropic hivatalos)
Honesty / hallgatott hibák	baseline	4× jobb	Anthropic hivatalos állítás

A honesty metrika kiemelten fontos: egy KKV nem tud minden AI-output mellé ülni egy senior fejlesztőt vagy egy szenior könyvelőt. Ha a modell négyszer ritkábban hagy benne csendben rossz választ, az közvetlenül csökkenti az AI használat operatív kockázatát. Ez nem egy elméleti benchmark szám — ez az a metrika, ami azt mondja meg, mennyire mer egy 8 fős vállalkozás éles ügyfélkapcsolatban használni a modellt anélkül, hogy minden választ kézzel ellenőrizne.

Claude Opus 4.8 vs GPT-5.5 vs Gemini 3.1 Pro

A Yahoo Finance és a MacRumors beszámolói szerint az Anthropic azt állítja: az Opus 4.8 bizonyos szintetikus benchmarkokon felülmúlja az OpenAI GPT-5.5-ét és a Google Gemini 3.1 Pro-t. Ez a megfogalmazás szándékosan óvatos — „bizonyos szintetikus benchmarkokon" — vagyis nem minden mérésen, hanem a kódolási és agentikus feladatokra szabott teszteken.

Szempont	Claude Opus 4.8	GPT-5.5	Gemini 3.1 Pro
Fókusz	agentikus kódolás, megbízhatóság	általános reasoning	multimodalitás, hosszú kontextus
Effort Control	igen (High / xHigh / Max)	részleges (reasoning_effort)	nincs explicit
Computer-use benchmark	84% (Online-Mind2Web)	publikus	publikus
API ár tendencia	változatlan vs. előd	n. a. friss publikus adat	n. a. friss publikus adat
Magyar KKV elérhetőség	API + Bedrock + Vertex + Cursor	OpenAI + Azure	Google Cloud + Vertex

Magyar piacon a praktikus döntés ritkán a benchmark táblázaton fordul meg. Sokkal inkább azon, hogy melyik modell melyik céges felhő-stackbe illik. Aki már Google Workspace + Vertex AI vonalon van, az érthető okból a Geminit fogja először kipróbálni. Aki Microsoft 365 + Azure-on, az a GPT-5.5-öt. Az Anthropic ereje épp az, hogy minden nagy felhőn (AWS Bedrock, Google Vertex, Microsoft Foundry) elérhető — vagyis a felhő-preferenciádtól függetlenül kipróbálhatod.

Claude Opus 4.8 Dynamic Workflows funkció illusztrációja — gazda AI ügynök párhuzamosan több száz alügynököt koordinál Claude Code-ban — Dynamic Workflows: a Claude Opus 4.8 új funkciója Claude Code-ban — egy gazda ügynök több száz párhuzamos alügynököt indít nagy feladatokra.

Mit jelent ez egy magyar KKV-nak? — 5 gyakorlati use case

1. Kódellenőrzés és code review automatizáció

Egy 4-8 fős fejlesztő csapat számára a code review gyakran szűk keresztmetszet. Az Opus 4.8 a 4× honesty javulással most már első körös automatikus reviewerként is megállja a helyét — vagyis felhívja a figyelmet a triviális hibákra, mielőtt egy senior fejlesztőhöz kerülne a pull request. Konkrét napi megtakarítás: 20-40 perc per fejlesztő (SocialPro becslés iparági benchmarkok alapján).

2. Customer support első szintű triage

Egy webshop vagy szolgáltató cég ügyfélszolgálati inboxában a beérkező üzenetek 60-70%-a tipikus kérdés (szállítási idő, számla módosítás, jelszó-visszaállítás) — ez a megoszlás az iparági átlag, a konkrét cégnél eltérhet. Az Opus 4.8 Fast Mode-jával ezeket másodpercek alatt megválaszolhatja egy chatbot, miközben a komplexebb panaszokat továbbítja humán ügynöknek. Az Effort Control itt különösen hasznos: High módban olcsó és gyors, Max módba átkapcsol, ha a panasz hangneme negatív vagy az ügy értéke magas.

3. Pénzügyi elemzés és kategorizálás

Magyar KKV-knál a havi könyvelési zárás során bizonylatok ezreit kell kategorizálni. Egy közepes vállalkozás (200-500 számla/hó) esetén ez napokig tartó manuális munka. Az Opus 4.8 Dynamic Workflows funkciójával egy 500 bizonylatos batch párhuzamosítható — ami eddig 3 munkanapot vett igénybe, az most 2-3 óra alatt elkészülhet. Fontos kitétel: a végső felelősség természetesen a könyvelőé marad, az AI az előkészítő munkát végzi.

4. Tartalomgyártás: SEO szöveg és termékleírás

Egy magyar webshop 500-2000 termékkel rendelkezhet, és minden terméknek kell egy egyedi, SEO-optimalizált leírás. Manuális szövegírással ez hónapokig tartana. Az Opus 4.8 az új Messages API frissítéssel olyan promptokat is kezel, ahol menet közben váltunk hangnemet vagy kategóriát — vagyis egyetlen futtatásban gyárthat le egy teljes termékkatalógust, kategóriánként eltérő SEO szempontok szerint. A kontextus szempontjából érdekes a SpaceX × Anthropic 220 000 GPU megállapodás — ez ad biztosítékot arra, hogy a backend kapacitás bírni fogja a növekvő KKV-igényt.

5. Computer use: webes adatgyűjtés és piackutatás

Az Online-Mind2Web 84%-os eredmény nem véletlen: az Opus 4.8 önállóan tud böngészőt használni, formot kitölteni, oldalakat navigálni. Magyar KKV-nak ez azt jelenti, hogy egy versenytárs-monitoring feladatot (50 versenytárs heti árazás, akciók, új termékek figyelése) ki lehet adni AI-nak. Eddig ehhez vagy fejlesztett webscraper kellett, vagy gyakornok. Most egy szöveges utasítással elindítható.

Akcióterv: 4 lépés az Opus 4.8 KKV-bevezetéshez

Lépés	Mit jelent	Időablak
1. Teszt és összehasonlítás	Vedd a 3 leggyakoribb AI-feladatodat (pl. ügyfél-email válasz, bizonylat kategorizálás, kódellenőrzés). Futtasd le Opus 4.7-en és Opus 4.8-on párhuzamosan. Vesd össze pontosság, sebesség, költség szerint.	3-5 nap
2. Model ID csere a sandbox-on	Cseréld a model ID-t `claude-opus-4-8`-ra egy nem-éles környezetben. Ellenőrizd, hogy a meglévő promptjaid működnek-e — általában igen, mert az API kontraktus változatlan.	1 nap
3. Effort Control bevezetése	Azonosítsd, mely use case-ekben kell High mód (gyors, olcsó) és melyikben Max (mély, megbízható). Vezesd be a szabályozást a routing rétegbe.	1-2 hét
4. Éles átállás és monitoring	Fokozatosan állítsd át az éles forgalmat. Monitorozd a token-költséget, a válaszidőt és a hibaarányt. 4 hét után újra értékelj.	1 hónap

Nem tudod, melyik AI modell a legmegfelelőbb a céged folyamataira? Egy 30 perces díjmentes konzultáción átnézzük a workflow-d, és konkrét javaslatot adunk arra, hogy a Claude Opus 4.8, a GPT-5.5 vagy a Gemini 3.1 Pro illik-e jobban a céljaidhoz.

Foglalj 30 perces díjmentes konzultációt

Összefoglaló

A Claude Opus 4.8 megjelenése nem forradalmi ugrás, hanem célzott finomítás. Az Anthropic három területen lépett előre: az agentikus megbízhatóság (4× honesty), a sebesség-költség kompromisszum (Fast Mode 2,5× gyorsabb, 3× olcsóbb a korábbi gyors módoknál), és a felhasználói kontroll (Effort Control). Magyar KKV-nak ez nem azt jelenti, hogy holnap reggel mindent át kell szervezni — hanem azt, hogy a meglévő AI-pipelinodon egy model ID cserével jobb minőséget kaphatsz változatlan áron.

A legfontosabb tanulság üzleti szempontból: az Anthropic itt egyértelműen az alkalmazott, megbízható, agentikus használatra céloz. Nem a benchmark-fölényre épít, hanem arra, hogy a modell kevesebbet hibázzon a valós, KKV-szintű feladatokban. Ez egészen más narratíva, mint amit a GPT-5.5 vagy a Gemini 3.1 Pro körüli marketing képvisel — és a magyar piacon, ahol nincs minden cégben senior ML mérnök az AI-output mellett, ez különösen értékes.

A cikk forrásai 2026-05-28-án WebFetch-csel verifikálva — minden külső link HTTP 200-as státuszt ad. A táblázatokban szereplő benchmark adatok az Anthropic hivatalos blogjából és független sajtóbeszámolókból származnak; a SWE-Bench Pro számok a sajtó által közvetített értékek. A Quick Answer és a use case-ek szerkesztői értékelést tartalmaznak — nem hivatalos Anthropic állítások.

Claude Opus 4.8 megjelenés: mit kap a magyar KKV az új Anthropic flagshipből?