Il 31 maggio, NVIDIA ha annunciato l'inizio della produzione del suo CPU Vera, posizionando il chip a 88 core come il primo processore dell'industria dei data center progettato specificamente per i carichi di lavoro degli agenti AI. Anthropic, OpenAI, SpaceXAI, Oracle Cloud Infrastructure, ByteDance e CoreWeave sono tra i primi utenti che pianificano implementazioni, secondo il comunicato stampa dell'azienda.

Il chip rappresenta la spinta più aggressiva di NVIDIA oltre le GPU e nel mercato delle CPU che Intel e AMD dominano da decenni. Dove Grace, il precedente chip server di NVIDIA basato su ARM, ha spedito circa 2,5 milioni di unità fino ad oggi, Vera introduce un'architettura di core completamente personalizzata chiamata Olympus piuttosto che concedere in licenza un design di core ARM standard, secondo quanto riportato da Tom's Hardware.

Perché i carichi di lavoro AI Agent stanno ridefinendo la domanda di CPU nei data center

L'economia dei data center per l'intelligenza artificiale è cambiata. Man mano che i modelli progrediscono da rispondere a domande a eseguire codice, invocando programmi e coordinando compiti complessi, la CPU diventa un problema chiave. Jensen Huang, CEO di NVIDIA, ha descritto il potenziale direttamente, "Gli agenti AI saranno i maggiori utilizzatori del calcolo... Vera è la prima CPU progettata per quel futuro, costruita per eseguire AI agentica a iperscala con prestazioni, efficienza e programmabilità straordinarie."

Le specifiche di Vera illustrano il suo potenziale. Presenta 88 core Olympus, insieme alla tecnologia di Multithreading Spaziale dell'azienda, completata da un sistema di memoria LPDDR5X, che offre fino a 1,2 TB al secondo di larghezza di banda consumando meno di 30 watt di potenza di memoria. Secondo il produttore, Vera può eseguire compiti a 1,8 volte la velocità dei processori x86 quando lavora su applicazioni AI agentiche come la compilazione di codice, l'esecuzione di Python, Java e la manipolazione di database.

Test indipendenti condotti da Phoronix, utilizzando benchmark selezionati da NVIDIA, hanno mostrato che Vera compila un kernel Linux in 20 secondi (in una configurazione con socket singolo), dando un incremento delle prestazioni del 10% rispetto all'AMD EPYC 9575F che opera a 5,0 GHz, come affermato dal blog di NVIDIA. Il fondatore di Phoronix, Michael Larabel, ha detto che Vera "finisce per dare un colpo pesante con competitività rispetto alle CPU Intel/AMD x86_64 che non ho mai visto da nessun altro processore ARM o non x86_64."

Tuttavia, questo viene con una condizione poiché i benchmark utilizzati sopra sono stati selezionati e eseguiti da NVIDIA stessa. Finora non sono stati effettuati test indipendenti.

Adozione precoce del mercato da parte di laboratori AI, hyperscalers e attori aziendali

Il roster dei clienti di Vera include istituzioni di ricerca AI, hyperscalers e infrastrutture finanziarie. In dichiarazioni fornite dal presidente della NYSE, Lynn Martin, l'exchange, che gestisce più di 1,1 trilioni di messaggi al giorno, intende utilizzare Vera insieme a Redpanda e Hewlett Packard Enterprise per aumentare la capacità e ridurre la latenza.

Secondo James Bradbury, il responsabile del calcolo di Anthropic, l'azienda sta valutando Vera per carichi di lavoro agentici ad alta intensità di CPU. "Scalare il calcolo è un accelerante importante per la crescita dei modelli," ha detto Bradbury. "Siamo entusiasti di vedere Vera emergere come una parte promettente dell'ecosistema per risolvere carichi di lavoro agentici."

Oracle Cloud Infrastructure ha in programma di diventare il primo hyperscaler a utilizzare Vera, con il vicepresidente esecutivo di OCI Mahesh Thiagarajan che lo ha definito "la prossima frontiera nel supercalcolo AI hyperscale".

Dal lato della produzione hardware, Dell Technologies, HPE, Lenovo e Supermicro offriranno Vera in configurazioni di server CPU standalone. NVIDIA ha descritto questo come "la prima opzione standard di CPU oltre x86" da parte dei principali OEM. I produttori taiwanesi, tra cui ASUS, Foxconn, GIGABYTE, Quanta Cloud Technology e Wistron, stanno anche costruendo sistemi.

Integrazione più ampia attraverso lo stack di infrastruttura AI di NVIDIA

Vera si inserisce perfettamente nella visione dell'ecosistema della fabbrica AI full-stack di NVIDIA. Vera funziona come l'host CPU della piattaforma Vera Rubin, che si abbina alle GPU Rubin utilizzando NVLink-C2C di seconda generazione con una larghezza di banda di 1,8 TB/s. Inoltre, Vera fa parte della piattaforma BlueField-4 STX in termini di networking e storage. Secondo Dealroom, Ian Buck, l'esecutivo di NVIDIA, ha consegnato le prime unità di Vera a clienti come Anthropic a San Francisco e SpaceXAI a Palo Alto.

La catena di fornitura della memoria ha reagito immediatamente. DIGITIMES afferma che il passo di NVIDIA di commercializzare Vera come chip separato crea domanda per DRAM a basso consumo, ponendo così ulteriore stress sulla già tesa catena di fornitura di chip di memoria.

Cosa tenere d'occhio mentre Vera entra nella fase di distribuzione

I sistemi Vera verranno spediti a partner e fornitori di cloud nel terzo trimestre di quest'anno. Tuttavia, alcune questioni da considerare sono se i risultati dei benchmark indipendenti contro una gamma di applicazioni generali supportano l'affermazione di NVIDIA sulle prestazioni e se il chip Olympus personalizzato può competere con la capacità del software x86 per la compatibilità delle applicazioni. In questo momento, però, una cosa è chiara: NVIDIA non è più contenta di possedere solo l'acceleratore. Vuole l'intero stack del data center AI.

Non limitarti a leggere le notizie crypto. Comprendile. Iscriviti alla nostra newsletter. È gratuita.