ElevenLabs și Google Cloud au anunțat o extindere pe mai mulți ani a colaborării strategice, cu obiectivul de a face instrumentele de voce bazate pe inteligență artificială mai accesibile companiilor și mai ușor de scalat pentru implementări mari.
Potrivit anunțului, acordul se bazează pe infrastructura globală AI a Google Cloud și pe infrastructura AI NVIDIA, pentru a susține produse care alimentează agenți vocali în timp real și localizarea conținutului în peste 70 de limbi.
Infrastructura: G4 VMs și GPU-uri NVIDIA RTX PRO 6000 Blackwell
Elementul tehnic central al acordului este utilizarea mașinilor virtuale G4 (Compute Engine) de la Google Cloud, echipate cu GPU-uri NVIDIA RTX PRO 6000 Blackwell, pentru antrenarea și servirea modelelor vocale ElevenLabs. Companiile spun că noua etapă oferă acces la un cluster semnificativ mai mare de GPU-uri Blackwell, ceea ce ar trebui să ajute la livrarea mai stabilă a implementărilor enterprise și la creșterea capacității de cercetare.
Google Cloud a prezentat G4 VMs ca o platformă orientată către workload-uri sensibile la latență (inferență multimodală, randare, simulare), iar trecerea ElevenLabs pe această generație de instanțe indică o prioritate clară: răspunsuri rapide și consistență în scenarii cu trafic mare, în special pentru agenți vocali în timp real.
Ce vizează ElevenLabs: agenți vocali și localizare la scară
În comunicatul public, ElevenLabs menționează că tehnologia sa este folosită de companii pentru agenți AI capabili să răspundă „instantaneu” și „natural” în aproape orice limbă, precum și pentru localizarea bibliotecilor mari de conținut în peste 70 de limbi. Sunt amintite și utilizări precum generarea de voci de brand consistente și producerea de materiale multimedia pentru publicitate, training intern și educarea clienților, în sectoare precum servicii financiare, retail și telecom.
Marketplace și achiziție mai simplă pentru companii
Un alt punct important este componenta comercială: soluțiile ElevenLabs sunt disponibile în Google Cloud Marketplace, ceea ce permite unor clienți să achiziționeze și să scaleze agenți conversaționali pentru suport clienți, training intern sau vânzări inbound, cu facturare simplificată și cadre de conformitate asociate ecosistemului Google Cloud.
Integrare Gemini și Veo în platformele ElevenLabs
Parteneriatul nu se oprește la infrastructură. ElevenLabs spune că integrează modelele Gemini direct în Agents Platform, pentru a susține raționament și planificare în mai mulți pași în cazul asistenților vocali. Separat, compania afirmă că integrează Veo în Creative Platform, pentru a accelera producția de conținut multimedia, inclusiv video și audio.
Ce spun companiile: viteză, fiabilitate și „scală”
În declarațiile incluse în anunț, Mati Staniszewski, cofondator ElevenLabs, a descris extinderea accesului la infrastructură ca un pas spre inferență mai rapidă și fiabilitate crescută pentru modele multimodale și agenți vocali folosiți la scară enterprise.
Matt Renner, President și Chief Revenue Officer la Google Cloud, a pus accent pe ideea de experiențe mai „naturale” pentru clienți la nivel global, prin folosirea stack-ului AI Google Cloud și a computing-ului accelerat NVIDIA. Ian Buck, vicepreședinte și director general Hyperscale and HPC la NVIDIA, a legat colaborarea de beneficiile arhitecturii Blackwell pentru antrenare mai rapidă și inferență la scară.
De ce contează anunțul pentru piața enterprise
Dincolo de branding, comunicatul scoate în evidență o realitate practică: aplicațiile vocale în timp real au nevoie de latență mică, capacitate predictibilă și integrare bună cu instrumente de conformitate și procurement. Migrarea către instanțe GPU de ultimă generație și listarea în Marketplace sunt două piese care adresează exact aceste cerințe, mai ales pentru companiile care vor să implementeze agenți conversaționali în fluxuri critice (suport, vânzări, training).





