Un metodo per correggere gli errori dei robot in tempo reale? Esiste una possibilità

MIT e NVIDIA hanno studiato una tecnica di correzione degli errori dei robot che, a differenza di altre, non richiede di raccogliere nuovi dati o riaddestrare il modello di intelligenza artificiale del robot.

Grazie a un nuovo sistema sviluppato dai ricercatori del MIT e di NVIDIA, si potrebbero correggere facilmente il comportamento dei robot in tempo reale.

Questo metodo consentirebbe agli utenti di guidare il robot in modo intuitivo: indicando l’oggetto sullo schermo, tracciando una traiettoria o persino spostando fisicamente il braccio del robot nella giusta direzione.

A differenza di altre tecniche, questa innovazione non richiede di raccogliere nuovi dati o riaddestrare il modello di intelligenza artificiale del robot, rendendolo immediatamente adattabile a nuove situazioni.

Maggiore precisione senza bisogno di riaddestramento

I ricercatori hanno testato questa tecnologia, ottenendo un tasso di successo superiore del 21% rispetto ad altri metodi che non sfruttano l’intervento umano.

Il loro obiettivo è rendere i robot più facilmente personalizzabili per gli utenti domestici, permettendo loro di svolgere una varietà di compiti anche in ambienti sconosciuti.
Felix Yanwei Wang, dottorando in ingegneria elettrica e informatica presso il MIT e autore principale dello studio, spiega: «Non possiamo aspettarci che gli utenti raccolgano dati e riaddestrino un modello di rete neurale. Il consumatore si aspetta che il robot funzioni subito e, se non lo fa, vuole un meccanismo intuitivo per personalizzarlo». Il sistema sviluppato affronta proprio questa sfida.

Superare il problema dell’allineamento

I modelli di intelligenza artificiale generativa sono sempre più utilizzati per insegnare ai robot a completare compiti complessi, imparando un insieme di regole chiamato “policy”. Tuttavia, anche se i movimenti appresi durante l’addestramento sono validi, non sempre si allineano alle esigenze dell’utente nella vita reale.

Ad esempio, un robot addestrato a prendere scatole da uno scaffale senza farle cadere potrebbe non essere in grado di afferrare una scatola su uno scaffale con una disposizione diversa da quelle viste in fase di apprendimento. Tradizionalmente, la soluzione a questi problemi richiederebbe di raccogliere nuovi dati e riaddestrare il modello, un processo lungo e complesso.

Un’interazione intuitiva per correggere il robot

Invece di dover riaddestrare il robot, il nuovo metodo consente agli utenti di correggerne il comportamento in tempo reale attraverso tre modalità:

  • Indicazione visiva: l’utente può puntare l’oggetto desiderato in un’interfaccia che mostra la visuale della telecamera del robot.
  • Tracciamento del percorso: è possibile disegnare una traiettoria sullo schermo, specificando come il robot dovrebbe raggiungere l’oggetto.
  • Interazione fisica: l’utente può muovere direttamente il braccio del robot nella direzione corretta.

Tra queste opzioni, il contatto fisico è il metodo più preciso, poiché evita la perdita di informazioni che può verificarsi quando si traduce un’immagine 2D in movimenti 3D.

Un algoritmo intelligente per evitare errori

Per garantire che le correzioni dell’utente non inducano il robot a compiere azioni non valide, come urtare altri oggetti, i ricercatori hanno sviluppato una procedura di campionamento specifica. Questo approccio permette al robot di scegliere l’azione più vicina all’obiettivo dell’utente, mantenendo al tempo stesso la coerenza con i comportamenti appresi.

«Non imponiamo semplicemente la volontà dell’utente», spiega Wang. «Piuttosto, gli diamo un’indicazione dell’obiettivo desiderato, lasciando però al modello la possibilità di oscillare tra i comportamenti che ha già appreso».

Verso robot sempre più autonomi

I test condotti in un ambiente simulato e su un braccio robotico reale in una cucina giocattolo hanno dimostrato che questo metodo è più efficace rispetto ad altri sistemi. Anche se il robot non sempre completa il compito immediatamente, l’utente può correggerlo sul momento, senza dover aspettare che finisca l’azione per poi dare nuovi comandi.

Inoltre, se l’utente corregge più volte lo stesso errore, il robot può memorizzare le correzioni e utilizzarle in futuro. Ad esempio, dopo aver ricevuto alcune indicazioni, il giorno successivo sarà in grado di afferrare automaticamente la ciotola giusta senza bisogno di ulteriori aiuti.

I ricercatori MIT ora vogliono ottimizzare la velocità della procedura di campionamento per migliorare ulteriormente le prestazioni del robot. Inoltre, prevedono di testare il loro metodo in ambienti nuovi e più complessi, con l’obiettivo di rendere i robot domestici ancora più adattabili e facili da usare.

calendar_month

a cura di Stefano Belviolandi