Anthropic lansează Opus 4.5: model frontieră cu performanțe mai bune la cod și costuri API mai mici

Urmareste-ne pentru cele mai recente stiri din lumea tehnologiei

Anthropic a anunțat lansarea Opus 4.5, cel mai nou model de vârf din gama Claude, cu îmbunătățiri importante pentru programatori, dezvoltatori și utilizatorii obișnuiți. Noua versiune aduce un salt în performanțele de cod, o experiență de conversație mai fluidă și, poate la fel de important, costuri API semnificativ reduse.

Continut

Conversații mai fluide: sfârșit pentru „hard stop”-urile bruște în Claude Performanță la cod: Opus 4.5 trece pragul de 80% pe SWE-Bench Verified Mai puțină „vorbărie”, mai multă eficiență: Opus 4.5 este mult mai economic în tokeni Noul parametru „effort”: control mai fin între viteză, cost și calitate Claude Code ajunge în aplicațiile desktop Securitate: mai rezistent la prompt injection, dar nu perfect API mai accesibil: preț redus de trei ori pentru Opus 4.5 Ce înseamnă Opus 4.5 pentru ecosistemul AI

Pe partea de benchmark-uri, Opus 4.5 urcă în topul modelelor de limbaj, dar schimbările de arhitectură și modul în care gestionează contextul îl fac relevant nu doar prin scoruri, ci și prin felul în care se simte în utilizare de zi cu zi.

Conversații mai fluide: sfârșit pentru „hard stop”-urile bruște în Claude

Una dintre cele mai vizibile schimbări pentru utilizatori este modul în care aplicațiile Claude (web, mobil, desktop) gestionează conversațiile lungi.

Până acum, modelul lovea în mod explicit limita de context (~200.000 de tokeni) și închidea sesiunea brusc, chiar dacă utilizatorul mai avea buget de utilizare rămas. Anthropic a preferat această variantă în locul unei soluții în care modelul „taie” mesaje vechi și devine treptat incoerent.

- Publicitate -

Cu Opus 4.5, Claude schimbă strategia:

atunci când se apropie de limita de context,
modelul rulează în fundal un proces de rezumare și compactare a contextului,
menține elementele importante din discuție și renunță la detaliile considerate redundante,
astfel, conversația poate continua fără întreruperi bruște și fără o „amnezie” totală asupra discuțiilor anterioare.

Acest comportament nou nu se aplică doar lui Opus 4.5, ci și celorlalte modele Claude din aplicațiile Anthropic.

Performanță la cod: Opus 4.5 trece pragul de 80% pe SWE-Bench Verified

Opus 4.5 este poziționat direct ca model frontieră pentru programare, debugging și scenarii de tip agent (agentic coding și tool use). Pe benchmark-ul SWE-Bench Verified, modelul devine primul care depășește pragul de 80% acuratețe:

Opus 4.5: 80,9%
GPT-5.1-Codex-Max: 77,9%
Gemini 3 Pro: 76,2%

Modelul excelează în:

rezolvarea automată de task-uri de cod într-un repo complex,
utilizarea instrumentelor (tool use) în lanțuri de acțiuni,
scenarii „agentice” în care AI trebuie să planifice și să execute pași multipli.

Pe de altă parte, Anthropic recunoaște că GPT-5.1 rămâne în față la raționament vizual (benchmark-uri de tip MMMU), ceea ce sugerează că fiecare model își conturează propriile zone forte.

- Publicitate -

Mai puțină „vorbărie”, mai multă eficiență: Opus 4.5 este mult mai economic în tokeni

Dincolo de scoruri, una dintre cele mai importante schimbări este modul în care Opus 4.5 utilizează tokenii. Modelul este optimizat pentru a livra răspunsuri mai concise la același nivel de calitate sau chiar mai bun.

Anthropic oferă exemple interne:

la nivel de „medium effort”,
- Opus 4.5 egalează scorul maxim obținut de Sonnet 4.5 pe SWE-Bench Verified,
- dar folosește cu 76% mai puțini tokeni de ieșire;
la nivelul maxim de effort,
- Opus 4.5 depășește Sonnet 4.5 cu 4,3 puncte procentuale,
- folosind cu 48% mai puțini tokeni.

Pentru utilizatori și companii, asta înseamnă:

costuri mai mici pentru același volum de lucru,
răspunsuri mai dense în conținut, cu mai puțin „balast” verbal,
posibilitatea de a rula proiecte complexe cu bugete de tokeni mai mici.

Noul parametru „effort”: control mai fin între viteză, cost și calitate

Pe platforma pentru dezvoltatori, Anthropic introduce un nou parametru: effort. Acesta permite reglarea explicită a „nivelului de efort” pe care modelul îl depune pentru o sarcină.

Practic, dezvoltatorii pot alege:

- Publicitate -

effort mai redus → răspunsuri mai rapide, mai ieftine, suficient de bune pentru task-uri simple;
effort mai ridicat → lanțuri de reasoning mai profunde, mai multe iterații interne și, implicit, o calitate superioară în task-uri complexe (cod, planificare, analiză).

Combinat cu noua eficiență în tokeni, acest parametru deschide calea către profiluri de utilizare foarte fine, adaptate nevoilor fiecărei aplicații.

Claude Code ajunge în aplicațiile desktop

O altă noutate importantă pentru dezvoltatori este extinderea Claude Code:

până acum, disponibil prin CLI, extensii de IDE și versiunea web,
acum, integrarea este prezentă și în aplicațiile desktop Claude.

Interfața de desktop devine tabbed:

un tab pentru chat-ul clasic cu modelul,
un tab dedicat experienței Claude Code, orientate pe editare, refactorizare și generare de cod.

Pentru programatori, asta înseamnă un flux de lucru mai unificat: nu mai este nevoie să sară între aplicații sau moduri separate doar pentru task-uri de coding.

Securitate: mai rezistent la prompt injection, dar nu perfect

Anthropic afirmă că Opus 4.5 este semnificativ mai robust la atacuri de tip prompt injection decât:

modele Claude anterioare,
modele competitoare precum GPT-5.1 și Gemini 3 Pro.

Chiar și așa, compania admite că niciun model nu este perfect în acest moment. Atacurile sofisticate de prompt injection rămân un vector de risc important, iar evoluțiile din zona de securitate AI vor continua.

API mai accesibil: preț redus de trei ori pentru Opus 4.5

Un element cheie al lansării este schimbarea de preț pentru utilizarea Opus 4.5 prin API:

Input: 5 USD / 1 milion de tokeni (în loc de 15 USD)
Output: 25 USD / 1 milion de tokeni (în loc de 75 USD)

Reducerea este semnificativă și face modelul:

mult mai atractiv pentru startup-uri și echipe mici,
o alternativă reală la modelele competitorilor din segmentul „frontier models”,
mai ușor de folosit în aplicații cu volum mare de conținut generat.

Pe lângă aceasta, Anthropic încurajează dezvoltatorii să adopte strategii de context management și context compaction, inspirate din modul în care aplicațiile proprii Claude gestionează conversațiile lungi.

Ce înseamnă Opus 4.5 pentru ecosistemul AI

Prin lansarea Opus 4.5, Anthropic:

își întărește poziția pe segmentul AI pentru programare și tool use,
oferă utilizatorilor finali o experiență de chat mai stabilă, fără întreruperi bruște,
scade bariera de intrare prin prețuri API mai accesibile și un model mai eficient în tokeni,
continuă să experimenteze cu mecanisme de siguranță și rezistență la prompt injection.

Într-un context în care GPT-5.1, Gemini 3 Pro și alte modele ridică ștacheta, Opus 4.5 marchează o etapă în care calitatea conversației, eficiența economică și integrarea în fluxurile reale de lucru devin la fel de importante ca scorurile brute în benchmark-uri.

Ramai la curent cu noutatile pe Google

Urmareste-ne pentru cele mai recente stiri din lumea tehnologiei

Anthropic lansează Opus 4.5: model frontieră cu performanțe mai bune la cod și costuri API mai mici

Conversații mai fluide: sfârșit pentru „hard stop”-urile bruște în Claude

Performanță la cod: Opus 4.5 trece pragul de 80% pe SWE-Bench Verified

Mai puțină „vorbărie”, mai multă eficiență: Opus 4.5 este mult mai economic în tokeni

Noul parametru „effort”: control mai fin între viteză, cost și calitate

Claude Code ajunge în aplicațiile desktop

Securitate: mai rezistent la prompt injection, dar nu perfect

API mai accesibil: preț redus de trei ori pentru Opus 4.5

Ce înseamnă Opus 4.5 pentru ecosistemul AI

Articole recomandate parteneri

Lasă un răspuns Anulează răspunsul

Recent

HP anunță laptopuri și desktopuri cu NVIDIA RTX Spark, gândite pentru noile experiențe Windows

iOS 27 beta este disponibil: cum îl instalezi pe iPhone, iPad și Apple Watch

Siri AI întârzie pe termen nedefinit în Uniunea Europeană pe iOS 27 și iPadOS 27

Crazy Taxi World Tour readuce haosul arcade în 2027

Watch us on Twitch

Trending

Yahoo Mail a tăiat stocarea la 15 GB. Cum eliberezi spațiu sau faci upgrade

DevTalks, cel mai mare eveniment de tehnologie din Europa Centrală și de Est, revine pe 3-4 iunie la Romexpo

Patru setări Samsung care pot îmbunătăți fotografiile făcute cu telefonul

Popular

Android TV pe televizoarele vechi: de ce încetinesc în timp și ce poți face în privința asta

BEST Training Week 2026: Competențe relevante pentru o carieră în continuă schimbare

DNSC, Poliția Română, ARB și Mastercard lansează campania „Uniți împotriva escrocheriilor”

We love music

INFO

IT MANIA - Tehnologia la zi

Recomandari

Ai un pont ?

Parteneriate

Conversații mai fluide: sfârșit pentru „hard stop”-urile bruște în Claude

Relaționat

Performanță la cod: Opus 4.5 trece pragul de 80% pe SWE-Bench Verified

Mai puțină „vorbărie”, mai multă eficiență: Opus 4.5 este mult mai economic în tokeni

Noul parametru „effort”: control mai fin între viteză, cost și calitate

Claude Code ajunge în aplicațiile desktop

Securitate: mai rezistent la prompt injection, dar nu perfect

API mai accesibil: preț redus de trei ori pentru Opus 4.5

Ce înseamnă Opus 4.5 pentru ecosistemul AI

Articole recomandate parteneri

You Might Also Like

Abonează-te la newsletter

Fiți la curent ! Primiți cele mai recente știri din lumea tehnologiei direct în căsuța dvs. de e-mail.

Lasă un răspuns Anulează răspunsul

Recent

Watch us on Twitch

Trending

Popular

We love music

S-ar putea să îți placă

IT MANIA - Tehnologia la zi