Nvidia GTC 2026:tracciare la rotta verso 1 trilione di dollari di entrate derivanti dall'intelligenza artificiale
Nvidia GTC (o GPU Technology Conference) è diventata una delle conferenze sull'intelligenza artificiale più importanti al mondo, crescendo ogni anno dal suo lancio nel 2009 insieme all'influenza e ai ricavi dell'azienda. Ma quest’anno ha segnato un cambiamento di enfasi. In passato, l'azienda si concentrava su come espandersi in nuovi mercati; quest’anno ha dimostrato come si espanderebbe in quei mercati, soprattutto come attore chiave nel panorama dell’intelligenza artificiale. In un chiaro segno delle ambizioni di Nvidia e del suo attuale successo, ha aggiornato la sua proiezione di 500 miliardi di dollari di entrate legate all'intelligenza artificiale entro il 2026 fino all'incredibile cifra di 1 trilione di dollari entro il 2027.
In particolare, il CEO Jensen Huang ha affrontato le crescenti esigenze di inferenza dell'intelligenza artificiale, nonché la rapida crescita dei carichi di lavoro degli agenti e il modo in cui tale crescita potrebbe avere un impatto sull'intero computing dell'intelligenza artificiale.
La visione di Nvidia per lo stack completo:la torta a 5 strati di AII
Dal dicembre 2025, Huang promuove l’idea di una “torta a cinque strati” di intelligenza artificiale. Questo concetto sembra incapsulare la strategia complessiva dell’azienda per l’intelligenza artificiale poiché cerca di comunicare la natura intrinsecamente verticale della tecnologia, che è molto più complessa di una semplice app o modello. L’intelligenza artificiale è descritta come un’infrastruttura critica con più livelli che vanno dai requisiti energetici sottostanti fino alle singole applicazioni. Ciò tenta anche di semplificare la complessità di uno stack AI completo per la persona media.

La torta di intelligenza artificiale a cinque strati di Nvidia
Foto per gentile concessione di Nvidia
Alla base di questo stack c’è l’energia, che sta attirando sempre più attenzione in quanto fattore limitante per la quantità di elaborazione che può essere sviluppata in una determinata posizione. A loro volta, i chip che utilizzano quell’energia determinano la quantità di calcolo disponibile per risolvere i problemi dell’IA. Poi arriva l’infrastruttura che supporta questi chip con terreni, edifici, fornitura di energia, apparecchiature informatiche, raffreddamento e rete. L'infrastruttura consente modelli di intelligenza artificiale, che variano a seconda dell'applicazione e del caso d'uso. Al livello più alto, le applicazioni stesse sfruttano i risultati del modello per fornire risultati a consumatori, utenti aziendali, enti governativi e così via, sulla base del valore economico dell'IA.
Huang ha affermato che l’intero stack informatico deve essere reinventato per supportare “la più grande costruzione di infrastrutture nella storia umana”. Nvidia sta utilizzando questo messaggio per posizionarsi non solo come produttore di chip, ma come abilitatore fondamentale per tutti i computer perché tutti i computer si stanno ora spostando verso l’intelligenza artificiale. Il CEO parla dell'approccio di Nvidia che combina "integrazione verticale e apertura orizzontale", il che significa che i suoi modelli sono aperti a chiunque, ma il suo approccio all'informatica è integrato verticalmente a ogni livello.
Vera Rubin Pod, LPX e l'opportunità di entrate 10x
Vera Rubin è l'imminente piattaforma di elaborazione di fascia alta per Nvidia che combina le sue CPU Vera e GPU Rubin; la spedizione è prevista tra qualche mese. Vera Rubin Pod è l’offerta su scala rack di Nvidia che promette di fornire un ulteriore aumento significativo della densità di calcolo dell’intelligenza artificiale all’interno dei data center. Incorpora sette tipi di chip Nvidia su cinque diversi sistemi rack per creare una configurazione ad alte prestazioni che, secondo l'azienda, consentirà la generazione di token - e le entrate - fino a 10 volte la velocità della piattaforma Blackwell di ultima generazione. Nvidia sostiene che ciò potrebbe consentire un'opportunità di inferenza annuale pari a 300 miliardi di dollari.

Grafico che analizza le opportunità di inferenza architettonica di Nvidia
Foto per gentile concessione di Nvidia
Uno dei maggiori fattori abilitanti del Vera Rubin Pod è l'uso della piattaforma LPX di Groq, sfruttando il chip Groq 3 LM30. L'unità di elaborazione del linguaggio di Groq è intrinsecamente diversa dalle GPU di Nvidia, con una quantità significativa di SRAM (memoria ad accesso casuale statico) rispetto alla DRAM (memoria ad accesso casuale dinamico). Poiché aumenta la larghezza di banda della memoria di ben 55 volte rispetto a una GPU Rubin, la Groq LPU è intrinsecamente brava a gestire attività ad uso estremamente intensivo di memoria. Ciò aiuta a spiegare perché Nvidia ha acquisito la proprietà intellettuale di Groq e il suo talento più importante per 20 miliardi di dollari nel dicembre 2025.
Crescere oltre le GPU:un focus hardware diversificato
L'esempio di Groq mostra come Nvidia si stia allontanando dal tentativo di rendere le sue GPU la soluzione ad ogni problema. Sebbene l’ecosistema di Nvidia si sia espanso da tempo oltre le GPU, tale espansione è stata quasi sempre al servizio della GPU, sia tramite CPU, chip di rete o software. Con l'introduzione delle LPU Groq 3, l'architettura di calcolo di Nvidia ha davvero superato l'approccio basato esclusivamente sulla GPU.
Stiamo anche vedendo Nvidia iniziare a offrire prodotti come le proprie CPU interne basate su Arm all'interno di una soluzione rack di sola CPU. L'azienda sta posizionando la nuova CPU Vera a 88 core come competitiva con Intel e AMD per i data center. Queste CPU possono essere configurate con un massimo di 256 chip per rack e Nvidia ha già clienti, tra cui Meta, che desiderano implementarle. Andando oltre le CPU, Nvidia ha parlato anche della sua soluzione Bluefield 4 STX per applicazioni orientate allo storage; secondo l'azienda, questo prodotto migliora le prestazioni per evitare che lo storage costituisca un collo di bottiglia per l'output dell'intelligenza artificiale.
Altri prodotti Vera Rubin:Nvidia DSX AI Factory e Space 1
Nvidia DSX è l'ultima piattaforma basata su Vera Rubin dell'azienda per la sua offerta AI Factory, che include un progetto di riferimento per le fabbriche AI e sfrutta Omniverse Digital Twin di Nvidia. (Per informazioni su Omniverse, vedere il mio articolo su GTC 2025 e lo sguardo dettagliato del mio collega Bill Curtis sulle mosse di Nvidia nell'intelligenza artificiale fisica a partire da febbraio 2025.) L'azienda la definisce una soluzione chiavi in mano che sfrutta tutte le capacità che Nvidia e i suoi partner hanno creato per aiutare a pianificare, costruire e mantenere le fabbriche di intelligenza artificiale. Questa piattaforma è progettata per implementazioni con hyperscaler e le più grandi aziende che desiderano implementare la propria intelligenza artificiale su scala industriale senza dover mettere insieme l'infrastruttura.
Ultimamente si è parlato molto anche dell'informatica basata sull'intelligenza artificiale nello spazio, con il lancio di molte startup per risolvere i problemi di implementazione. Prima dell'annuncio del modulo Space 1 basato su Vera Rubin, Nvidia utilizzava principalmente chip Jetson Orin integrati e GPU H100 per applicazioni spaziali. Nvidia afferma che il nuovo modulo focalizzato sullo spazio è stato progettato per queste applicazioni estreme e offre fino a 25 volte le prestazioni AI nello spazio dell'H100. Dispone inoltre di elaborazione lockstep e codici di correzione degli errori per garantire che il funzionamento nello spazio non influisca sull'output. Detto questo, credo che Space 1 affronterà un'applicazione piuttosto di nicchia e non dovrebbe essere visto come una conferma della necessità di data center nello spazio.
NemoClaw:costruire agenti specializzati
L'intelligenza artificiale di Agentic è diventata rapidamente un'importante area di interesse poiché agenti come Claude Code aiutano gli utenti ad affrontare compiti pratici. Dal punto di vista tecnico, gli agenti stanno rimodellando il modo in cui viene costruita l’infrastruttura IT e il modo in cui vengono progettati i chip al suo interno. Uno degli sviluppi recenti più interessanti è l'introduzione di OpenClaw, un agente open source che viene eseguito localmente utilizzando il nuovo stack NemoClaw open source di Nvidia per implementazioni più sicure di agenti orientati alle attività.
Il toolkit dell'agente NemoClaw è progettato per costruire, addestrare e distribuire agenti IA autonomi e sicuri, il che dovrebbe rendere più semplice per chiunque creare i propri agenti. Nello sviluppo del nuovo stack, Nvidia ha lavorato a stretto contatto con il creatore di OpenClaw e i ricercatori sulla sicurezza per aiutare a prevenire azioni di agenti indesiderati o risultati potenzialmente pericolosi.
DLSS 5.0:la controversa implementazione del rendering neurale
Nvidia ha sorpreso molti, me compreso, con l'annuncio di DLSS 5.0, la funzionalità opzionale assistita dall'intelligenza artificiale dell'azienda per migliorare la qualità dell'immagine e fornire un rendering più veloce. Funziona eseguendo il rendering a una risoluzione inferiore e quindi utilizzando l'intelligenza artificiale per convertire l'immagine alla risoluzione nativa. La maggior parte degli utenti sembra essere soddisfatta delle precedenti implementazioni di DLSS. Ora, DLSS 5.0 introduce tecniche di rendering neurale per migliorare ulteriormente l’illuminazione in scene che altrimenti potrebbero apparire piatte. Offre inoltre agli sviluppatori di giochi un maggiore controllo sull'esperienza utente e possono ottimizzare DLSS 5.0 per modificare il modo in cui influisce sulla grafica dei loro giochi.
Molte persone hanno reagito negativamente alle prime foto e ai video realizzati utilizzando DLSS 5.0. Penso che questa sia una reazione eccessiva significativa. Ci sono molti giocatori che odiano la maggior parte delle cose potenziate dall'intelligenza artificiale e la reazione al DLSS 5.0 potrebbe essere il culmine di quella frustrazione. Avendo visto le demo di persona, posso dire che quasi tutti i miglioramenti sembrano essere positivi e aumentare il realismo - e questo viene da un fotografo serio che può essere molto esigente riguardo agli strumenti di editing. Oltre a ciò, DLSS 5.0 è ancora lontano dalla consegna, quindi non è chiaro esattamente come sarà il prodotto finale o quali GPU saranno in grado di eseguirlo. L'attuale istanziazione funziona su due schede grafiche Nvidia RTX 5090, ma, secondo Nvidia, il software sarà ottimizzato per funzionare su una singola GPU entro l'autunno.
Il punto di flessione dell'inferenza e la proiezione di mercato da 1 trilione di dollari di Huang
Nelle sue osservazioni al GTC, Huang ha parlato delle crescenti opportunità di guadagno legate all'intelligenza artificiale per il settore, aggiungendo che "la domanda di GPU Nvidia è fuori scala". Ha affermato che la crescita dell'inferenza sta generando entrate significativamente maggiori dall'edizione speciale di GTC tenutasi a Washington, D.C., alla fine del 2025 (di cui ho scritto qui).
Anche se ciò è accaduto solo pochi mesi fa, l’azienda sta ora aggiornando le sue opportunità di fatturato previste di 500 miliardi di dollari fino al 2026 fino a 1 trilione di dollari fino al 2027. Ciò significa che Nvidia non solo si aspetta che quest’anno finisca alla grande, ma si aspetta anche che il 2027 sia ancora più forte – centinaia di miliardi di dollari più forti. Dal mio punto di vista di analista, aveva senso pensare che la transizione dalla formazione sull’intelligenza artificiale all’inferenza diffusa dell’intelligenza artificiale e all’intelligenza artificiale pervasiva sarebbe stato un fattore trainante significativo per il settore. Ma se Huang ha ragione, potrebbe rivelarsi un catalizzatore di crescita ancora più efficace, per Nvidia e i suoi partner, di quanto chiunque avrebbe immaginato non molto tempo fa.
Divulgazione:Nvidia è un cliente consulente della mia azienda, Moor Insights &Strategy.
Articoli in Evidenza
- I modi migliori per guadagnare denaro nelle cassette postali (reddito passivo)
- Come avviare un servizio di consegna
- Branding guidato dalle emozioni e branding basato sui dati
- Cos'è Ramp-Up?
- Che cos'è una multinazionale (MNC)?
- Che cos'è una catena di approvvigionamento?
- A prova di futuro la sala riunioni
- Che cos'è la diversificazione del prodotto?
- Che cos'è una società di portafoglio?
- Che cos'è la pianificazione aziendale integrata e perché è importante?
-
Come i millennial possono costruire un gruzzolo per la pensione La chiave per vivere la tua vita migliore nei tuoi anni doro è iniziare a investire presto secondo lautore di Everyday Millionaires Chris Hogan. Tuttavia, secondo Charles Schwab, solo il 37% dei gio...
-
Cosa sono i costi inventariabili? costi inventariabili, noto anche come costo del prodotto, si riferiscono ai costi diretti associati alla fabbricazione dei prodotti e alla loro preparazione per la vendita. Spesso, i costi inventariab...
