Technológia

Anthropic Claude Opus 4.6: Egy millió tokennyi ugrás a kódolásban

Az Anthropic kiadta a Claude Opus 4.6-ot 1 millió tokenes kontextusablakkal, ezzel kihívva az OpenAI GPT-5.3-Codex modelljét az AI-alapú szoftverfejlesztésben való dominanciáért, miközben az iparág a felhajtásból a gyakorlati alkalmazás felé mozdul el.

R
Redakcia
Share
Anthropic Claude Opus 4.6: Egy millió tokennyi ugrás a kódolásban

Az AI-alapú következtetés új dimenziója

Az Anthropic 2026. február 5-én mutatta be a Claude Opus 4.6-ot, ami az év eddigi legjelentősebb AI modellfrissítése lehet. A legfontosabb fejlesztés: egy 1 millió tokenes kontextusablak – amely jelenleg béta verzióban érhető el a Claude Developer Platformon – amely akár 1500 oldalnyi szöveget, 30 000 sornyi kódot vagy több mint egy órányi videót is képes befogadni egyetlen promptban. A kontextuskapacitás ugrásszerű növekedése újradefiniálja, hogy hogyan nézhet ki a gyakorlatban egy vállalati szintű AI-asszisztens.

A kibővített kontextus mellett az Anthropic bemutatta az ügynökcsapatokat, egy olyan funkciót, amely lehetővé teszi, hogy több Claude-példány párhuzamosan, autonóm módon koordináljon komplex feladatokat. A vállalat emellett bevezette az adaptív gondolkodást, amely nagyobb kontrollt biztosít a fejlesztők számára a következtetés mélysége, a sebesség és a költség közötti egyensúly felett. Az árazás változatlan marad: 5 dollár/millió bemeneti token és 25 dollár/millió kimeneti token.

Kódolási fegyverkezési verseny az OpenAI-jal

A kiadás az Anthropic-ot közvetlen versenyhelyzetbe hozza az OpenAI GPT-5.3-Codex modelljével, amely ugyanazon a napon jelent meg. Több elemző által közzétett benchmarkok árnyalt képet festenek: nincs egyetlen modell, amely minden tesztben győzne. A Claude Opus 4.6 a következtetés-igényes értékeléseken – GPQA Diamond, MMLU Pro és TAU-bench – vezet, míg a GPT-5.3-Codex a terminál- és számítógép-használati terheléseken, például a Terminal-Bench 2.0 és a SWE-Bench Pro esetében dominál.

Az Anthropic saját belső benchmarkja, a GDPval-AA – amely a pénzügyi, jogi és más ágazatokban a gazdaságilag értékes tudásmunkában nyújtott teljesítményt méri – azt mutatja, hogy az Opus 4.6 körülbelül 144 Elo ponttal felülmúlja a GPT-5.2-t. A valós szoftverfejlesztés esetében a fejlesztők gyakorlati véleménye egyre inkább az, hogy a két modell kiegészíti egymást: a Claude az architektúrához és a biztonsági auditokhoz, a Codex a gyors, interaktív páros programozáshoz.

A Claude Code lábnyomának mértéke már most is feltűnő. Az Anthropic 2026-os Agentic Coding Trends Report szerint a Claude Code felelős a nyilvános GitHub commitok 4%-áért 2026 januárjában, és a becslések szerint ez az arány az év végére meghaladhatja a 20%-ot.

2026: Az év, amikor az AI pragmatikussá vált

Az Opus 4.6 bevezetése az iparág számára kulcsfontosságú pillanatban érkezik. Az elemzők és kutatócégek általánosan egyetértenek abban, hogy 2026 a skálázási ambícióktól a gyakorlati alkalmazás felé való elmozdulást jelenti. Ahogy a TechCrunch januárban megjegyezte, a hangsúly az egyre nagyobb modellek építéséről a valós érték bizonyítására helyeződik át. A Gartner előrejelzése szerint 2026 végére a vállalati alkalmazások 40%-a fog AI-ügynököket beépíteni, szemben a 2025-ös kevesebb mint 5%-kal. Az ambíciók és az elfogadás közötti szakadék azonban továbbra is jelentős – a megkérdezett szervezeteknek jelenleg csak 11%-a futtat ügynöki AI-t éles környezetben.

A hardveres fogadások alátámasztják az AI-boomot

A szoftververseny elválaszthatatlan a számítási kapacitásért folytatott egyidejű küzdelemtől. Február 24-én a Meta és az AMD bejelentett egy mérföldkőnek számító partnerséget, amelynek értéke öt év alatt akár 60 milliárd dollár is lehet, és amely a Meta globális adatközpontjaiban akár 6 gigawattnyi AMD Instinct GPU és a következő generációs EPYC CPU telepítését is magában foglalja. Az első szállítmányok várhatóan 2026 második felében érkeznek meg. Az üzlet közel 9%-kal emelte az AMD részvényeinek árfolyamát, és jelzi a hiperszkálázók szélesebb körű törekvését az Nvidia-tól való függőség csökkentésére. Az olyan AI modell szolgáltatók számára, mint az Anthropic, a bőséges és sokszínű GPU-ellátás gyorsabb következtetést és alacsonyabb költségeket jelent – ami elengedhetetlen a millió tokenes kontextusok skálázott futtatásához.

Mit jelent ez

A Claude Opus 4.6 érkezése, párosulva az alatta kiépülő hardveres infrastruktúrával, azt sugallja, hogy az AI egy érettebb szakaszba lép – amelyet kevésbé a lenyűgöző demók, inkább a mérhető termelékenységnövekedés határoz meg. Az, hogy az Anthropic vagy az OpenAI fog-e dominálni az ügynöki kódolási piacon, továbbra is nyitott kérdés; a válasz éppúgy függhet az ökoszisztéma integrációjától és a fejlesztői bizalomtól, mint a benchmark pontszámoktól.

Ez a cikk más nyelveken is elérhető:

Kapcsolódó cikkek