Az Anthropic befejezte Claude Opus 4.5-ös AI modelljének ...

Az Anthropic hétfőn bemutatta a Claude Opus 4.5-öt, így teljes lett hárommodelles családja, és ezzel a cég az elmúlt két hónap harmadik nagy dobása. Az új zászlóshajó modell nemcsak a kódolási benchmarkok élére került, de árcsökkentéssel is meglepte a piacot.

Ez a gyors tempóval zajló bevezetés szeptember végén indult a Claude Sonnet 4.5-tel, folytatódott októberben a Claude Haiku 4.5-tel, majd most az Opus is csatlakozott, így az Anthropic fejlesztőknek egy teljes eszköztárat kínál: az Opus a komplex, éles feladatokhoz, a Sonnet a hétköznapi kihívásokhoz, a Haiku pedig a gyors, egyszerű logikát igénylő munkákhoz.

A Claude Opus 4.5 lenyűgöző eredményeket ért el: 80,9%-os teljesítményt produkált a SWE-bench Verified teszten, amely valós szoftvermérnöki feladatokat vizsgál. Ezzel megelőzte az OpenAI GPT-5.1-Codex-Max modelljét, ami 77,9%-os, valamint a Google Gemini 3 Pro-ját, amely 76,2%-ot ért el. Az Anthropic azt is állítja, hogy az Opus minden belső teljesítményvizsgán felülmúlt minden emberi jelöltet – ez egy kétórás teszt, amely az ítélőképességet méri stresszes helyzetben.

Az év végéhez közeledve zajlik a nagy verseny az AI fejlesztők között a legjobb helyezésekért. A Google november 18-án dobta piacra a Gemini 3 Pro-t, amelyet a multimodális érvelés forradalmi előrelépéseként hirdettek. Másnap az OpenAI érkezett a GPT-5.1-Codex-Max modelljével.

Az Anthropic válasza nem is késett, pár nappal később érkezett az Opus 4.5, ráadásul meglepő árazással: az input tokenenként 5 dollárt, az output tokenenként pedig 25 dollárt kérnek, ami 67%-os visszaesést jelent az előző Opus modellhez képest.

Közben az Alibaba Qwen modelljei is belépnek a versenybe. A Qwen2.5-Max január végén érkezett, több mint 20 billió tanító tokennel, és állításuk szerint felülmúlja a DeepSeek-V3 modellt a fontos benchmarkokon. A szeptemberben bemutatott Qwen3-Max több mint egy billió paraméterrel a világ harmadik legjobbja az LMArena ranglistán, és különféle feladatokban is kiemelkedik, például mély kutatásban, multimodális érvelésben vagy keleti nyelvű munkafolyamatokban. Bár a Qwen modellek kevésbé ismertek a nyugati piacokon, jól mutatják Kína ambícióját az AI önellátás felé az amerikai chipexport-korlátozások közepette.

Az árazás az OpenAI GPT-5.1 modelljének árfolyama ($1.25/$10) és az Anthropic régebbi Opus 4.1-é ($15/$75) között helyezkedik el, bár még mindig drágább a Gemini 3 Pro ($2/$12) árainál. Ez az árcsökkentés jól jelzi, hogy a piac nemcsak a képességeken, hanem a gazdaságosságon is egyre erősebben versenyez.

Claude legfrissebb verziója még mindig valamivel drágább az ázsiai vetélytársaknál, de cserébe technikailag is fejlettebb. Így a felhasználók most már választhatnak az ár-érték arány vagy a tiszta teljesítmény között.

A Sonnet 4.5 szeptember végén érkezett, a fejlett kódolási és ágens képességek mérsékelt áron való elérését hozva, és bizonyos feladatokban jobb volt az Opus 4.1-nél. A szimplább Haiku 4.5 októberben mutatkozott be. Az Opus 4.5 pedig a csúcson áll: képes kezelni a legösszetettebb érveléseket és a leghosszabb futamidejű munkákat.

A Sonnethez és GPT-5-höz hasonlóan a Claude Opus 4.5 is egy úgynevezett „hibrid érvelési” architektúrán alapul – egyetlen modell, amely egyszerre képes közvetlen következtetésekre és láncolt gondolkodásra is. Támogatja a 200 000 tokenes kontextusablakot, és akár 64 000 token kimenetét is képes előállítani. Tudásbázisának időkorlátja 2025 márciusa, ami egy kicsit frissebb, mint a Sonnet januári adatai.

Simon Willison fejlesztő hétvégi tesztelése során az Opus 4.5-tel egy projektjét refaktorálta. A modell 20 commitot végzett 39 fájlban, 2022 új sort adott hozzá, miközben 1173 sort eltávolított. Willison szerint „egyenesen kiváló az új modell”, bár azt megjegyezte, hogy Sonnet 4.5-re való visszatérés sem csökkentette látványosan a hatékonyságát.

„Nem mondom, hogy az új modell nem fejlődés a Sonnet 4.5-höz képest, de nem tudok magabiztosan kijelenteni jelentős képességbeli különbséget a két verzió között a számomra adott kihívások alapján” – írta.

Theo Browne, fejlesztő, YouTuber és a T3 Chat AI platform vezérigazgatója „őrületesnek” nevezte a Claude Opus 4.5-öt, és egy videós beszámolóban úgy fogalmazott, hogy „határozottan ez a valaha készült legjobb kódolási modell.”

Az AI piac egyre zsúfoltabb. A Google Gemini 3 Pro legutóbbi sikere, amely 1501 pontot ért el az LMArena-n, széles körű figyelmet kapott, és felkapta a Salesforce vezére, Marc Benioff is, aki bejelentette, hogy lemond a ChatGPT-ről és a Google modelljére vált. Ez a bejelentés 6%-nál is nagyobb árfolyamnyereséget hozott az Alphabet részvényeinek, és állítólag az OpenAI vezérigazgatóját, Sam Altmant is megzavarta, aki szerint a Gemini „ideiglenes gazdasági hullámvölgyet” okozhat.

Múlt héten a Microsoft és az Nvidia többmilliárd dolláros befektetést jelentett be az Anthropicban, ami a startup értékét körülbelül 350 milliárd dollárra emelte. Az együttműködés bővített Azure integrációt, valamint Nvidia által támogatott infrastruktúrát biztosít a Claude modellek képzéséhez és futtatásához.

Az Opus 4.5 azonnal elérhető az Anthropic API-ján keresztül, továbbá az AWS Bedrockon, a Google Vertex AI platformon, valamint a Claude webes és asztali alkalmazásaiban.

Az Anthropic befejezte Claude Opus 4.5-ös AI modelljének ...

Cikk megosztása