Robotica

GEN-1, il modello di Physical AI che rende i robot intelligenti e affidabili (al 99%)



Indirizzo copiato

GEN-1 di Generalist AI è un nuovo modello di intelligenza artificiale fisica che supera per la prima volta la soglia di affidabilità necessaria per l’impiego commerciale su larga scala. Con tassi di successo medi del 99% su compiti complessi e velocità di esecuzione circa tre volte superiori allo stato dell’arte, il modello segna un salto qualitativo rispetto alla generazione precedente – e apre scenari concreti per l’impiego in applicazioni di automazione industriale avanzata.

Pubblicato il 7 apr 2026



GEN-1
AI Questions Icon
Chiedi all'AI
Riassumi questo articolo
Approfondisci con altre fonti



Per decenni la robotica industriale ha risolto il problema dell’affidabilità attraverso la ripetizione meccanica: ambienti controllati, movimenti predefiniti, zero improvvisazione. I nuovi modelli di intelligenza artificiale fisica promettono qualcosa di diverso – robot capaci di adattarsi, recuperare da errori, operare in ambienti non strutturati – ma fino a oggi lo hanno fatto con tassi di successo troppo bassi per essere economicamente utili. GEN-1, il nuovo modello di Generalist AI presentato il 2 aprile 2026, è il primo a colmare concretamente questo divario: 99% di successo medio su una serie di compiti manuali complessi, velocità di esecuzione circa tre volte superiori allo stato dell’arte, e appena un’ora di dati specifici necessari per addestrarlo su un nuovo compito.

La società, che sviluppa modelli di intelligenza artificiale per il mondo fisico (Physical AI), aveva già pubblicato a novembre 2025 i risultati di GEN-0, il primo modello in grado di dimostrare l’esistenza di leggi di scala in robotica analoghe a quelle che hanno guidato l’evoluzione dei grandi modelli linguistici. GEN-1 parte da quella fondazione e la porta a un livello superiore, combinando un dataset di pretraining ora cresciuto a oltre mezzo milione di ore di interazione fisica con avanzamenti algoritmici nel post-training, nell’apprendimento per rinforzo e nelle tecniche di inferenza.

Affidabilità, velocità e improvvisazione: i tre assi della valutazione

Per valutare le prestazioni di GEN-1 Generalist AI adotta tre criteri che nel loro insieme definiscono ciò che chiama mastery – padronanza. Il primo è l’affidabilità: la capacità di completare ripetutamente un compito senza intervento umano. Nei test documentati, GEN-1 ha assemblato automaticamente componenti automotive per oltre un’ora consecutiva, piegato scatole più di 200 volte di fila e confezionato blocchi per 1.800 cicli consecutivi senza interruzioni.

La seconda dimensione è la velocità di esecuzione. GEN-1 piega una scatola in 12,1 secondi – contro i circa 34 secondi impiegati sia da GEN-0 sia da π0 di Physical Intelligence sulle stesse scatole. Il confezionamento di uno smartphone richiede 15,5 secondi, rispetto ai 43 secondi di GEN-0. I video pubblicati dalla società mostrano queste prestazioni a velocità reale, non accelerata.

La terza dimensione – e quella che l’azienda considera più significativa dal punto di vista concettuale – è la capacità di improvvisazione. In scenari non previsti durante l’addestramento, GEN-1 mostra comportamenti adattivi: se una rondella scivola in una posizione anomala mentre il robot sta assemblando un kit di componenti automotive, il robot può scegliere tra diverse strategie di recupero, inclusa la manipolazione bimanuale. Questi comportamenti emergono dal pretraining su dati generali di interazione fisica, non da addestramento specifico per quelle situazioni.

Un’architettura nata senza dati robotici

L’aspetto forse più controintuitivo del sistema è la composizione del dataset di pretraining: il modello base non include alcun dato proveniente da robot. Il pretraining avviene su dati raccolti tramite dispositivi indossabili a basso costo, che catturano milioni di attività fisiche compiute da esseri umani. I dati robotici entrano solo nella fase di fine-tuning su compiti specifici – e in quantità ridotta, circa un’ora per compito.

Questo approccio distingue GEN-1 dai sistemi che raggiungono alte prestazioni accumulando migliaia di ore di dati raccolti tramite teleoperazione – cioè facendo pilotare il robot a distanza da operatori umani – un processo costoso e difficile da scalare. La società sostiene che il pretraining su dati umani trasferisce conoscenza della fisica del mondo reale in modo più generalizzabile di quanto non faccia la teleoperazione.

GEN-1 introduce anche un’evoluzione delle tecniche di inferenza denominata Harmonic Reasoning, che contribuisce ad abilitare le velocità di esecuzione osservate nei test. L’infrastruttura di training distribuita è stata ridisegnata per gestire petabyte di dati di interazione fisica.

Verso l’impiego industriale

Generalist AI posiziona esplicitamente GEN-1 come il primo modello general-purpose di Physical AI abbastanza affidabile e veloce da poter essere impiegato in contesti produttivi reali su una gamma ampia di compiti. Il confronto con l’evoluzione dei modelli linguistici è ricorrente nel paper: GPT-2 aveva dimostrato la scalabilità dell’approccio senza raggiungere applicabilità economica; GPT-3 aveva attraversato quella soglia per alcuni usi specifici. GEN-1 aspira a fare lo stesso per la robotica fisica.

La società riconosce però i limiti attuali: non tutti i compiti raggiungono il 99% di successo, e alcuni contesti industriali richiederebbero soglie ancora più elevate. Sul fronte della sicurezza e dell’allineamento, il paper solleva una questione specifica: i comportamenti emergenti – quelli non esplicitamente previsti dall’addestramento – possono essere una risorsa (recupero da situazioni impreviste) o un rischio (azioni fisiche con conseguenze reali non desiderate). L’azienda dichiara di lavorare a metodi di allineamento più precisi per governare questo aspetto.

L’accesso anticipato a GEN-1 è disponibile da oggi per i partner selezionati.


Articoli correlati