Indice
OpenAI ha presentato Jalapeño, il suo primo chip progettato internamente per far funzionare i modelli linguistici di ChatGPT. Si tratta di un passo che l’azienda definisce centrale nel proprio piano per controllare l’intera infrastruttura che fa girare i propri prodotti, dal software fino al silicio.
Cos’è esattamente Jalapeño
OpenAI lo chiama “Intelligence Processor”, un termine coniato apposta per distinguerlo dalle GPU generaliste. Non è un chip generico adattato ai modelli linguistici: è stato progettato da zero attorno alle esigenze specifiche dell’inferenza, cioè la fase in cui un modello già addestrato genera le risposte che arrivano agli utenti di ChatGPT, e non quella di addestramento, molto più dispendiosa in termini di calcolo puro.
Il progetto nasce dalla collaborazione tra tre aziende con ruoli distinti. OpenAI ha definito l’architettura, basandosi sulla propria esperienza diretta su come i modelli linguistici muovono dati, gestiscono la memoria e servono le richieste in tempo reale.
Broadcom ha messo a disposizione l’implementazione del silicio e le tecnologie di rete, incluso il proprio sistema di networking Tomahawk. Celestica si è occupata di schede, rack e integrazione dei sistemi a livello di data center.
Il dato che ha sorpreso di più gli analisti di settore è la velocità di sviluppo: dalla progettazione iniziale al tape-out, cioè il momento in cui il design viene inviato in fonderia per la produzione, sono passati solo nove mesi.
Broadcom lo descrive come uno dei cicli di sviluppo più rapidi mai raggiunti per un chip ad alte prestazioni di questa complessità, merito anche del fatto che OpenAI ha usato i propri stessi modelli AI per accelerare alcune fasi della progettazione.
Quanto è davvero più efficiente
Secondo le dichiarazioni di OpenAI, i primi campioni del chip stanno già eseguendo carichi di lavoro reali nei laboratori dell’azienda, alla frequenza e ai consumi target di produzione, incluso un carico basato sul modello GPT-5.3-Codex-Spark. I test preliminari indicherebbero un’efficienza per watt sostanzialmente superiore rispetto agli acceleratori più avanzati oggi sul mercato.
È importante essere onesti su un punto: si tratta per ora di numeri comunicati direttamente da OpenAI, non ancora verificati da un report tecnico indipendente. La stessa azienda dichiara che pubblicherà un documento con i benchmark dettagliati nei prossimi mesi, senza specificare contro quali chip concorrenti sia stato fatto il confronto.
Una cifra più concreta arriva invece da Bloomberg, che riporta una dichiarazione del CEO di Broadcom Hock Tan: secondo l’azienda, l’acceleratore mostrerebbe finora un risparmio sui costi di circa il 50% rispetto alle GPU generaliste tipicamente usate per questi compiti.
Perché OpenAI vuole il proprio chip
La ragione di fondo è semplice da capire: OpenAI è cresciuta a una velocità tale da non poter più dipendere esclusivamente dalle GPU Nvidia, che restano comunque centrali nella sua infrastruttura.
Controllare anche il silicio permette in teoria di ottimizzare i propri modelli, incluso il prossimo GPT-5.6, per farli funzionare più velocemente e a costi più bassi, migliorando al tempo stesso l’efficienza dell’addestramento e riducendo la dipendenza da fornitori terzi.
Jalapeño non nasce comunque dal nulla. L’accordo tra OpenAI e Broadcom era già stato annunciato nell’ottobre 2025, dopo 18 mesi di collaborazione preliminare: un piano pluriennale per co-sviluppare e distribuire 10 gigawatt di acceleratori e sistemi rack personalizzati, con le prime installazioni previste nella seconda metà del 2026 e un’estensione fino al 2029, insieme a Microsoft come partner principale per la fase di scala industriale.
Alcune ricostruzioni giornalistiche, non confermate ufficialmente dalle due aziende, riportano che Broadcom avrebbe chiesto a Microsoft di garantire l’acquisto del 40% della produzione iniziale per blindare il primo lotto di chip.
OpenAI, va detto, non sta puntando tutto su un solo fornitore alternativo. Nei mesi scorsi l’azienda ha siglato accordi anche con Amazon Web Services per l’uso dei chip Trainium, con AMD, storico rivale di Nvidia, e con Cerebras, l’azienda di chip AI quotata in borsa lo scorso maggio. La strategia, insomma, è diversificare il più possibile le fonti di calcolo disponibili, non sostituire Nvidia con un singolo concorrente.
OpenAI si unisce al club del silicio su misura
Jalapeño colloca OpenAI in una compagnia ormai affollata. Google ha le proprie TPU da anni, Amazon dispone di Trainium e Inferentia, Meta ha sviluppato MTIA, e Microsoft ha il proprio chip Maia.
Tutti i grandi acquirenti di potenza di calcolo per l’intelligenza artificiale, insomma, stanno arrivando alla stessa conclusione: quando i volumi diventano enormi e i carichi di lavoro sufficientemente stabili da giustificarlo, conviene progettare un ASIC, un chip dedicato a un compito specifico, piuttosto che continuare ad acquistare solo GPU generaliste, più flessibili ma anche più costose per quel singolo utilizzo.
Per Broadcom, che ha già aiutato Google a sviluppare le proprie TPU, questo accordo consolida un ruolo già centrale: quello di partner di fiducia per le aziende che vogliono progettare silicio su misura senza dover costruire da zero una divisione interna di progettazione hardware.
Non è un caso che le azioni della società siano cresciute di quasi sette volte dalla fine del 2022, complice proprio il boom della domanda di infrastrutture per l’AI, con un ulteriore rialzo subito dopo l’annuncio di Jalapeño.
Cosa cambia per Nvidia
Jalapeño, da solo, non rappresenta una minaccia immediata per Nvidia: nessun benchmark pubblico lo mette ancora a confronto diretto con i chip più recenti dell’azienda di Jensen Huang, e la produzione su scala reale comincerà solo entro fine 2026.
Il segnale politico, però, è chiaro: se anche il principale cliente di Nvidia tra i laboratori di intelligenza artificiale inizia a costruirsi alternative proprietarie, il prezzo delle GPU generaliste smette di essere un dato a cui i grandi acquirenti si limitano ad adattarsi.
Cosa sappiamo e cosa non sappiamo
Cosa sappiamo:
- Jalapeño è il primo chip progettato internamente da OpenAI, sviluppato con Broadcom (silicio e networking) e Celestica (rack e integrazione)
- È un ASIC pensato esclusivamente per l’inferenza dei modelli linguistici, non per l’addestramento
- Il percorso da progetto a produzione è durato nove mesi, descritto da Broadcom come uno dei ciclo di sviluppo più rapidi mai realizzati per un chip di queste dimensioni
- I primi esemplari stanno già eseguendo carichi di lavoro reali nei laboratori OpenAI, incluso il modello GPT-5.3-Codex-Spark
- L’accordo tra OpenAI e Broadcom, annunciato per la prima volta nell’ottobre 2025, prevede la fornitura di 10 gigawatt di acceleratori personalizzati entro il 2029, insieme a Microsoft
Cosa non sappiamo ancora:
- I numeri reali di performance per watt, perché si tratta finora di dati auto-dichiarati da OpenAI: il report tecnico completo, con benchmark verificabili, arriverà nei prossimi mesi
- Contro quali chip concorrenti sia stato condotto il confronto, e in quali condizioni esatte
- Se la stima del 50% di risparmio sui costi rispetto alle GPU generaliste, riportata da Bloomberg citando il CEO di Broadcom, regga anche fuori dal contesto controllato dei laboratori
- I dettagli sull’eventuale impegno di Microsoft ad acquistare una quota fissa della produzione, circolato in alcune ricostruzioni giornalistiche ma non confermato ufficialmente dalle due aziende
Domande frequenti su Jalapeno di OpenAI
Cos’è Jalapeño? È il primo chip progettato internamente da OpenAI, pensato esclusivamente per l’inferenza dei modelli linguistici, ovvero la fase in cui un modello già addestrato genera le risposte per gli utenti di ChatGPT.
Chi ha collaborato con OpenAI alla realizzazione del chip? Broadcom ha fornito l’implementazione del silicio e le tecnologie di rete, mentre Celestica si è occupata di schede, rack e integrazione dei sistemi nei data center.
Jalapeño sostituirà le GPU Nvidia usate da OpenAI? No, almeno non nel breve periodo. OpenAI continua a usare GPU Nvidia e ha accordi anche con AWS, AMD e Cerebras. Jalapeño si aggiunge a questo mix di fornitori, non lo sostituisce.
Quando sarà disponibile su scala Jalapeño? OpenAI punta a un primo dispiegamento su scala entro la fine del 2026, con un’espansione pianificata nei generazioni successive fino al 2029, in collaborazione con Microsoft.
Jalapeño è davvero più efficiente delle GPU attuali? Secondo OpenAI sì, con un’efficienza per watt sostanzialmente superiore e un risparmio sui costi stimato attorno al 50% secondo dichiarazioni di Broadcom. Sono però dati preliminari, non ancora confermati da un report tecnico indipendente.
Anche altre aziende hanno chip AI proprietari? Sì. Google ha le TPU, Amazon ha Trainium e Inferentia, Meta ha MTIA e Microsoft ha Maia. Jalapeño porta OpenAI a far parte dello stesso gruppo di aziende che progettano silicio su misura per i propri carichi di lavoro AI.
