OpenAI a anunțat oficial ChatGPT Images 2.0, noul său sistem de generare de imagini pentru ChatGPT, prezentat pe 21 aprilie 2026 ca un pas important față de generațiile anterioare. Potrivit companiei, modelul aduce o redare mai bună a textului, suport multilingv extins și o capacitate mai mare de a produce imagini care pot fi folosite direct în contexte editoriale, educaționale sau profesionale.
Lansarea vine la doar câteva luni după GPT Image 1.5, introdus în decembrie 2025, însă documentația OpenAI arată acum că gpt-image-2 este modelul de referință pentru generare și editare de imagini, în timp ce GPT Image 1.5 este listat drept modelul anterior.
În ChatGPT, ChatGPT Images 2.0 este disponibil pe toate planurile, iar opțiunea images with thinking este disponibilă pe planurile plătite, atunci când utilizatorul selectează modelele Thinking sau Pro.
Era raționamentului în generarea de imagini cu AI
Cea mai importantă schimbare ține de integrarea modului de raționare în procesul vizual. În system card-ul publicat de OpenAI, compania explică faptul că noul mod thinking poate integra căutare web în timp real, poate genera mai multe imagini dintr-un singur prompt și poate transforma o cerere simplă într-un rezultat mai bine documentat și mai atent structurat înainte ca imaginea să fie produsă efectiv.
Pentru dezvoltatori, această schimbare se reflectă și în API. Documentația oficială arată că gpt-image-2 poate fi folosit atât pentru generare, cât și pentru editare de imagini, iar prin Responses API pot fi construite fluxuri conversaționale și editări iterative, nu doar cereri punctuale, ceea ce mută modelul din zona de experiment vizual către o unealtă mai apropiată de producția reală.

Precizie, suport multilingv și un salt în redarea textului
OpenAI pune accent pe faptul că ChatGPT Images 2.0 face un salt vizibil în redarea textului în imagini, o problemă care a rămas mult timp una dintre limitele evidente ale modelelor generative. Pagina oficială de lansare insistă pe exemple cu layout-uri editoriale, postere, materiale educaționale și compoziții cu text dens, iar compania vorbește explicit și despre un suport mai bun pentru limbi și sisteme de scriere diferite.

Totuși, OpenAI recunoaște și limitele actuale ale modelului. În documentația API, compania notează că, deși redarea textului este „semnificativ îmbunătățită”, modelul încă poate avea dificultăți în plasarea exactă a elementelor, în claritatea perfectă a textului și în menținerea consecvenței vizuale complete între personaje sau elemente recurente.

Licențiere și disponibilitate
Dincolo de ChatGPT, gpt-image-2 este disponibil și în OpenAI API, unde este descris drept modelul de ultimă generație pentru generare rapidă, editare și lucru cu imagini de intrare de fidelitate ridicată. OpenAI precizează că modelul acceptă dimensiuni flexibile, iar ghidul tehnic include exemple care merg până la 3840×2160 pentru landscape și 2160×3840 pentru portrait, deși ieșirile care depășesc pragul uzual de 2K sunt marcate momentan ca experimentale.
În zona de costuri, pagina oficială de pricing indică pentru GPT-image-2 tarife de 8 dolari pentru inputurile de imagine, 2 dolari pentru cached inputs și 30 de dolari pentru outputuri, la care se adaugă costurile pentru text, respectiv 5 dolari pentru input și 1,25 dolari pentru cached input. Pentru companiile și echipele care vor să folosească modelul în producție, aceste valori contează mai ales în scenariile cu imagini complexe, editări iterative și volume mari de generare.
Standarde de siguranță
OpenAI spune că noul model vine și cu un pachet extins de măsuri de siguranță, tocmai pentru că realismul mai mare crește și riscurile de folosire abuzivă. System card-ul publicat de companie avertizează că, în lipsa unor protecții, capacitatea crescută a modelului ar putea permite deepfake-uri mai convingătoare, inclusiv imagini politice sau sensibile cu persoane, locuri și evenimente reale, motiv pentru care OpenAI aplică filtre atât la nivelul promptului, cât și la nivelul imaginilor de intrare și al rezultatului final.
Pe partea de proveniență, OpenAI afirmă că păstrează compatibilitatea cu standardul C2PA metadata și adaugă un watermark imperceptibil pentru a ajuta la identificarea imaginilor generate de produsele sale. Compania subliniază, totuși, că nu există o singură soluție tehnică suficientă pentru problema provenienței și că sistemul trebuie privit ca parte dintr-un efort mai larg de transparență.
Ce înseamnă pentru utilizatorii enterprise
Pentru zona enterprise, noutatea reală nu este doar calitatea vizuală, ci faptul că OpenAI tratează imaginea mai mult ca pe un rezultat construit logic decât ca pe o simplă ilustrare generată dintr-un prompt. Dacă această abordare funcționează constant și în uz real, ChatGPT Images 2.0 poate deveni util pentru materiale interne, explicații vizuale, concepte de produs, prototipuri grafice și conținut educațional, mai ales acolo unde textul și structura contează la fel de mult ca aspectul.
Există însă și un compromis clar: viteza. OpenAI notează în documentația sa că prompturile complexe pot ajunge la un timp de procesare de până la două minute, ceea ce sugerează că noua generație pune accentul pe rezultate mai bine gândite și mai aproape de producție, nu neapărat pe răspuns instant în toate cazurile.





