Anthropic a anunțat lansarea Opus 4.5, cel mai nou model de vârf din gama Claude, cu îmbunătățiri importante pentru programatori, dezvoltatori și utilizatorii obișnuiți. Noua versiune aduce un salt în performanțele de cod, o experiență de conversație mai fluidă și, poate la fel de important, costuri API semnificativ reduse.
- Conversații mai fluide: sfârșit pentru „hard stop”-urile bruște în Claude
- Performanță la cod: Opus 4.5 trece pragul de 80% pe SWE-Bench Verified
- Mai puțină „vorbărie”, mai multă eficiență: Opus 4.5 este mult mai economic în tokeni
- Noul parametru „effort”: control mai fin între viteză, cost și calitate
- Claude Code ajunge în aplicațiile desktop
- Securitate: mai rezistent la prompt injection, dar nu perfect
- API mai accesibil: preț redus de trei ori pentru Opus 4.5
- Ce înseamnă Opus 4.5 pentru ecosistemul AI
Pe partea de benchmark-uri, Opus 4.5 urcă în topul modelelor de limbaj, dar schimbările de arhitectură și modul în care gestionează contextul îl fac relevant nu doar prin scoruri, ci și prin felul în care se simte în utilizare de zi cu zi.
Conversații mai fluide: sfârșit pentru „hard stop”-urile bruște în Claude
Una dintre cele mai vizibile schimbări pentru utilizatori este modul în care aplicațiile Claude (web, mobil, desktop) gestionează conversațiile lungi.
Până acum, modelul lovea în mod explicit limita de context (~200.000 de tokeni) și închidea sesiunea brusc, chiar dacă utilizatorul mai avea buget de utilizare rămas. Anthropic a preferat această variantă în locul unei soluții în care modelul „taie” mesaje vechi și devine treptat incoerent.
Cu Opus 4.5, Claude schimbă strategia:
- atunci când se apropie de limita de context,
- modelul rulează în fundal un proces de rezumare și compactare a contextului,
- menține elementele importante din discuție și renunță la detaliile considerate redundante,
- astfel, conversația poate continua fără întreruperi bruște și fără o „amnezie” totală asupra discuțiilor anterioare.
Acest comportament nou nu se aplică doar lui Opus 4.5, ci și celorlalte modele Claude din aplicațiile Anthropic.
Performanță la cod: Opus 4.5 trece pragul de 80% pe SWE-Bench Verified
Opus 4.5 este poziționat direct ca model frontieră pentru programare, debugging și scenarii de tip agent (agentic coding și tool use). Pe benchmark-ul SWE-Bench Verified, modelul devine primul care depășește pragul de 80% acuratețe:
- Opus 4.5: 80,9%
- GPT-5.1-Codex-Max: 77,9%
- Gemini 3 Pro: 76,2%
Modelul excelează în:
- rezolvarea automată de task-uri de cod într-un repo complex,
- utilizarea instrumentelor (tool use) în lanțuri de acțiuni,
- scenarii „agentice” în care AI trebuie să planifice și să execute pași multipli.
Pe de altă parte, Anthropic recunoaște că GPT-5.1 rămâne în față la raționament vizual (benchmark-uri de tip MMMU), ceea ce sugerează că fiecare model își conturează propriile zone forte.
Mai puțină „vorbărie”, mai multă eficiență: Opus 4.5 este mult mai economic în tokeni
Dincolo de scoruri, una dintre cele mai importante schimbări este modul în care Opus 4.5 utilizează tokenii. Modelul este optimizat pentru a livra răspunsuri mai concise la același nivel de calitate sau chiar mai bun.
Anthropic oferă exemple interne:
- la nivel de „medium effort”,
- Opus 4.5 egalează scorul maxim obținut de Sonnet 4.5 pe SWE-Bench Verified,
- dar folosește cu 76% mai puțini tokeni de ieșire;
- la nivelul maxim de effort,
- Opus 4.5 depășește Sonnet 4.5 cu 4,3 puncte procentuale,
- folosind cu 48% mai puțini tokeni.
Pentru utilizatori și companii, asta înseamnă:
- costuri mai mici pentru același volum de lucru,
- răspunsuri mai dense în conținut, cu mai puțin „balast” verbal,
- posibilitatea de a rula proiecte complexe cu bugete de tokeni mai mici.
Noul parametru „effort”: control mai fin între viteză, cost și calitate
Pe platforma pentru dezvoltatori, Anthropic introduce un nou parametru: effort. Acesta permite reglarea explicită a „nivelului de efort” pe care modelul îl depune pentru o sarcină.
Practic, dezvoltatorii pot alege:
- effort mai redus → răspunsuri mai rapide, mai ieftine, suficient de bune pentru task-uri simple;
- effort mai ridicat → lanțuri de reasoning mai profunde, mai multe iterații interne și, implicit, o calitate superioară în task-uri complexe (cod, planificare, analiză).
Combinat cu noua eficiență în tokeni, acest parametru deschide calea către profiluri de utilizare foarte fine, adaptate nevoilor fiecărei aplicații.
Claude Code ajunge în aplicațiile desktop
O altă noutate importantă pentru dezvoltatori este extinderea Claude Code:
- până acum, disponibil prin CLI, extensii de IDE și versiunea web,
- acum, integrarea este prezentă și în aplicațiile desktop Claude.
Interfața de desktop devine tabbed:
- un tab pentru chat-ul clasic cu modelul,
- un tab dedicat experienței Claude Code, orientate pe editare, refactorizare și generare de cod.
Pentru programatori, asta înseamnă un flux de lucru mai unificat: nu mai este nevoie să sară între aplicații sau moduri separate doar pentru task-uri de coding.
Securitate: mai rezistent la prompt injection, dar nu perfect
Anthropic afirmă că Opus 4.5 este semnificativ mai robust la atacuri de tip prompt injection decât:
- modele Claude anterioare,
- modele competitoare precum GPT-5.1 și Gemini 3 Pro.
Chiar și așa, compania admite că niciun model nu este perfect în acest moment. Atacurile sofisticate de prompt injection rămân un vector de risc important, iar evoluțiile din zona de securitate AI vor continua.
API mai accesibil: preț redus de trei ori pentru Opus 4.5
Un element cheie al lansării este schimbarea de preț pentru utilizarea Opus 4.5 prin API:
- Input: 5 USD / 1 milion de tokeni (în loc de 15 USD)
- Output: 25 USD / 1 milion de tokeni (în loc de 75 USD)
Reducerea este semnificativă și face modelul:
- mult mai atractiv pentru startup-uri și echipe mici,
- o alternativă reală la modelele competitorilor din segmentul „frontier models”,
- mai ușor de folosit în aplicații cu volum mare de conținut generat.
Pe lângă aceasta, Anthropic încurajează dezvoltatorii să adopte strategii de context management și context compaction, inspirate din modul în care aplicațiile proprii Claude gestionează conversațiile lungi.
Ce înseamnă Opus 4.5 pentru ecosistemul AI
Prin lansarea Opus 4.5, Anthropic:
- își întărește poziția pe segmentul AI pentru programare și tool use,
- oferă utilizatorilor finali o experiență de chat mai stabilă, fără întreruperi bruște,
- scade bariera de intrare prin prețuri API mai accesibile și un model mai eficient în tokeni,
- continuă să experimenteze cu mecanisme de siguranță și rezistență la prompt injection.
Într-un context în care GPT-5.1, Gemini 3 Pro și alte modele ridică ștacheta, Opus 4.5 marchează o etapă în care calitatea conversației, eficiența economică și integrarea în fluxurile reale de lucru devin la fel de importante ca scorurile brute în benchmark-uri.






