Robotica e AI

Gemini Robotics on device: l’AI a bordo robot per un’automazione più rapida e sicura



Indirizzo copiato

Gemini Robotics on device porta i modelli di intelligenza artificiale avanzata RT-2 e SARA-RT direttamente a bordo dei robot, riducendo la latenza e la dipendenza dalla connettività di rete. Il risultato sono robot più veloci, sicuri e autonomi, capaci di interpretare comandi in linguaggio naturale e di eseguire compiti complessi in ambienti dinamici, con importanti implicazioni per l’industria manifatturiera e altri settori.

Pubblicato il 27 giu 2025



Umanoiode_Shutterstock_2458570667



L’integrazione dell’intelligenza artificiale nei sistemi robotici sta aprendo nuovi scenario applicativi con implicazioni dirette sulla produttività e sulla flessibilità dei processi industriali e non solo. Dopo aver annunciato pochi mesi fa Gemini Robotics ora Google DeepMind compie lo step successivo con Gemini Robotics on device, un modello di intelligenza artificiale in grado di operare direttamente a bordo dei dispositivi, sfruttando elaborazione locale e senza quindi la necessità di una connessione costante a server remoti. Si tratta, come si può facilmente immaginare, di un passaggio tecnico di notevole importanza per il settore, poiché consente ai robot di eseguire compiti complessi in modo più autonomo, rapido, efficiente e sicuro.

Velocità e sicurezza

La robotica tradizionale si basa su algoritmi pre-programmati e un’architettura di calcolo centralizzata. Un approccio efficace per compiti ripetitivi in ambienti controllati, ma che mostra i suoi limiti di fronte a scenari dinamici o attività che richiedono capacità di adattamento e “ragionamento”. La necessità di inviare dati a un server esterno per l’elaborazione e attendere le istruzioni di ritorno introduce una latenza incompatibile con applicazioni in tempo reale. La dipendenza dalla connettività di rete è inoltre un punto di debolezza per la stabilità del sistema e un ostacolo al suo impiego in aree con scarsa copertura.

L’approccio di Google DeepMind con i nuovi modelli della famiglia Gemini punta a superare proprio queste barriere. Portare l’elaborazione dei dati direttamente a bordo del robot significa abbattere i tempi di reazione. Un robot equipaggiato con un modello Gemini Robotics on-device analizza l’ambiente con i suoi sensori, ne comprende il contesto e prende decisioni in poche frazioni di secondo, con un’immediatezza fondamentale per operazioni delicate come l’assemblaggio di precisione o la manipolazione di oggetti fragili. L’elaborazione locale migliora anche la robustezza del sistema, che resta operativo anche senza connessione, e offre maggiori garanzie di sicurezza, perché i dati sensibili non devono lasciare l’impianto.

I modelli al cuore del sistema

Al centro di questa innovazione ci sono due modelli di intelligenza artificiale: RT-2, un modello VLA (visual-language-action), e SARA-RT, un’architettura più efficiente per l’uso pratico. RT-2 interpreta comandi in linguaggio naturale e li traduce in azioni, basandosi sull’analisi delle immagini che percepisce. Di fronte a un comando come “prendi la mela rossa”, il robot non solo identifica l’oggetto corretto, ma pianifica ed esegue i movimenti per afferrarlo, rendendo l’interazione uomo-macchina più intuitiva.

La notevole potenza di calcolo richiesta da modelli così avanzati ha però sempre rappresentato un limite per la loro adozione su hardware robotico standard. Qui entra in gioco SARA-RT (Super-efficient Architecture for Robotic Agents), una soluzione progettata per rendere i modelli VLA più leggeri e veloci. Attraverso una tecnica nota come up-training, SARA-RT distilla le capacità di modelli più grandi in una versione compatta e ottimizzata per l’hardware del robot. Questo processo garantisce prestazioni elevate con un impiego di risorse inferiore, rendendo la tecnologia accessibile a più dispositivi senza hardware costoso. L’efficienza è tale da aver mostrato, nei test, un raddoppio della velocità operativa.

Implicazioni per l’industria (e altre applicazioni)

Le applicazioni potenziali di questa tecnologia sono molto ampie e toccano numerosi settori. Nella manifattura i robot con intelligenza on-device possono gestire assemblaggi complessi, controllo qualità e logistica, adattandosi a nuovi prodotti o layout di fabbrica con una riprogrammazione minima. La comprensione del linguaggio naturale semplifica la gestione delle linee, permettendo anche a personale non tecnico di interagire con i sistemi automatizzati.

Ma la maggiore autonomia apre le porte anche ad altri scenari applicativi. L’elaborazione on-device permette infatti di abilitare la robotica per tutte quelle applicazioni dove la comunicazione remota è impossibile o inaffidabile.

Pensiamo alla robotica di servizio, all’assistenza sanitaria per supportare il personale medico o all’agricoltura di precisione, dove le macchine monitorano e intervengono sulle colture in modo mirato. Anche l’esplorazione spaziale o le operazioni in ambienti pericolosi possono trarre vantaggio da robot capaci di decidere in autonomia.

Articoli correlati

Articolo 1 di 4