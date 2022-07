Per alcuni minuti gli sforzi del piccolo robot ricordano quelli di un neonato, frustrato dall'incapacità di tenersi in piedi e muoversi autonomamente. Poi le cose cambiano velocemente. Appena 20 minuti e il robot riesce a girarsi sul “ventre”. Alla mezz'ora gattona. E dopo appena un'ora dall'inizio dell'esperimento cammina già sicuro sulle sue gambe. Come ci riesce? Merito di un nuovo metodo di addestramento ideato dai ricercatori dell'Università della California di Berkely, che permette al robot di imparare autonomamente come camminare (o portare a termine qualunque altro tipo di attività motoria) con un processo per tentativi ed errori, in una frazione del tempo che impiegano i robot tradizionali. O, se è per questo, i bambini della nostra specie.

A testimoniare i risultati ottenuti dai ricercatori californiani ci pensano un paper, disponibile per ora in preprint, e un video diffuso dagli stessi scienziati, che ripercorre l'intera epopea del piccolo robot. A rendere speciale l'impresa – spiegano – è il fatto che il metodo da loro testato unisce le due principali tecniche di intelligenza artificiale utilizzate per insegnare ai robot come portare a termine un nuovo compito, migliorando l'efficienza di entrambe.

In generale, la metodologia viene chiamata deep reinforcement learning, e prevede l'utilizzo di algoritmi che permettono l'apprendimento di un compito dall'analisi di un ampio set di dati, senza istruzioni precise, ma attraverso un processo di tentativi ed errori in cui viene premiato il raggiungimento di un determinato obbiettivo. Nel caso di un cane robot, l'algoritmo analizza i dati registrati dai sensori presenti sul suo corpo mentre compie movimenti inizialmente casuali, e premia quelli che lo avvicinano alla capacità di camminare, migliorandone così poco per volta le prestazioni.

Di norma, questo approccio ha un limite importante: il processo di apprendimento per tentativi ed errori richiede moltissimo tempo. Troppo – scrivono i ricercatori – per pensare di utilizzarlo realmente per applicazioni concrete. Un'alternativa più rapida, e quindi anche più usata, è quella di lasciar addestrare l'intelligenza artificiale del robot all'interno di una simulazione al computer (in cui il processo richiede molto meno tempo), per metterla poi alla prova solamente quando ha imparato a portare a termine il compito desiderato. “Le simulazioni però non riescono a catturare realmente la complessità di un ambiente reale – spiega al Dailymail Danijar Hafner, un ricercatore dell'Università della California di Berkeley che ha partecipato all'esperimento – per questo motivo un comportamento che funziona molto bene all'interno di una simulazione può risultare inutile per portare a termine un compito nel mondo reale”.

L'alternativa scelta dai ricercatori è quella di utilizzare un world model, cioè un modello virtuale creato a partire da esperienze raccolte nel mondo reale. Mentre il cane robot si agita per terra, quindi, i suoi sensori raccolgono continuamente dati con cui, in parallelo, viene costruita e poi aggiornata una simulazione, in cui l'intelligenza artificiale del robot si allena a camminare ad una velocità impossibile da raggiungere per un corpo fisico. In questo modo i ricercatori hanno ottenuto risultati affidabili come quelli che nascono dall'addestramento per tentativi ed errori nel mondo reale, ma con la rapidità garantita dalle simulazioni al computer. Il cane robot inoltre continua ad aggiornare continuamente il suo modello virtuale del mondo, e può imparare a rispondere rapidamente a nuove condizioni, come un urto o un malfunzionamento.

In futuro – racconta Hafner in un articolo su Mit Technology Review – i ricercatori pensano di equipaggiarlo con una telecamera, così da renderlo capace di muoversi all'interno di ambienti complessi, come può essere una stanza piena di mobili e persone. A quel punto l'idea è di anche dotarlo della capacità di comprendere comandi vocali, per renderlo sempre più indistinguibile da un cane in carne e ossa. Il problema al momento è solo uno: ogni capacità che si vuole far apprendere ai robot con questa tecnica deve essere specificata al momento della loro programmazione, indicando quali comportamenti vanno premiati dall'algoritmo e quali no. E quando si va un po' più il là di un semplice “alzati e cammina”, le cose, almeno per ora, si fanno lunghe ed estremamente complicate.