Processi onirici potrebbero aiutare a costruire robot più antropocentrici

Se l’Europa vuole sviluppare sistemi di intelligenza artificiale (IA) antropocentrici, questi devono essere adattivi alla variabilità umana. Il progetto DREAM ha utilizzato approfondimenti sui benefici del sonno per proporre un cambio di paradigma nel modo in cui progettiamo robot e IA.

Economia digitale

Costruire un programma di IA applicabile a qualsiasi situazione è molto difficile, perché tali situazioni e i loro comportamenti adattati devono prima essere individuati. L’intuizione che ha ispirato il progetto DREAM (Deferred Restructuring of Experience in Autonomous Machines), supportato dall’UE, si è basata sul fatto che processi simili a quelli individuati durante il sonno potrebbero aiutare i robot ad acquisire, organizzare e utilizzare più facilmente conoscenze e abilità. Esporre i robot a scenari più aperti nello spazio e nel tempo ha portato il team a presentare proposte per una nuova generazione di robot.

Algoritmi adattivi

Nel campo dell’apprendimento automatico, è stato suggerito l’ «apprendimento per rinforzo», che collega i comportamenti desiderati al riscontro positivo, per insegnare ai robot come portare a termine degli incarichi. Tuttavia, a causa di numerosi limiti, questo approccio non è stato ancora applicato. Il principale tra questi limiti è che gli algoritmi di fondo non possono attribuire causa ed effetto. Come spiega il prof. Stéphane Doncieux, responsabile del progetto, «Supponiamo che il robot riceva un segnale di valore numerico come riscontro positivo, per imparare davvero, l’algoritmo deve sapere a quale stato è associato questo valore: è dovuto al movimento del braccio, a un pulsante che viene spinto o a qualcos’altro?». DREAM ha ridotto la quantità di informazioni specifiche necessarie affinché un robot esegua un incarico, sviluppando algoritmi adattivi che potrebbero essere applicati a diversi scenari, ma che sono ancora in grado di trovare soluzioni appropriate senza continue modifiche. «Gli attuali algoritmi di apprendimento spesso prevedono conoscenze specialistiche. In realtà, l’apprendimento naturale offre opportunità se lo si sfrutta in modo appropriato. Questo ricorda ciò che accade quando gli animali e gli umani dormono», afferma il prof. Doncieux. In termini pratici, l’apprendimento dei robot diventa una sequenza di processi che alternano le interazioni con il mondo reale e lo sfruttamento dei dati generati, piuttosto che un singolo processo. Durante le sessioni di “veglia”, il robot ha osservato le conseguenze delle sue azioni per capire come è strutturato l’ambiente. Durante il “sogno”, il robot ha esplorato, in simulazione, molte possibili interazioni, registrando quelle che hanno generato effetti individuabili su un oggetto scelto (ad es. spostandolo). Ora potrebbe svolgere compiti semplici ma solo entro parametri precisi, fornendo una sorta di libreria di azioni con cui addestrare algoritmi di apprendimento profondo. Un altro processo di “sogno” basato su tali algoritmi ha aiutato il robot a estenderli ad altre situazioni. Altre fasi di “sogno” sono state incentrate sull’apprendimento per trasferimento, per sviluppare le conoscenze acquisite. Sono stati esplorati vari approcci tra cui il trasferimento dalla memoria a breve termine a quella a lungo termine e il trasferimento tra persone diverse (apprendimento sociale), poiché è stato dimostrato che le conoscenze acquisite all’interno di un gruppo accelerano l’apprendimento e lo rendono più solido.

Un nuovo paradigma a portata di mano

DREAM ha sperimentato diversi robot umanoidi PR2 e Baxter, ad esempio, concentrandosi sull’interazione degli oggetti usando le loro braccia. «I robot hanno riconosciuto su quali parti degli ambienti possono agire per ottenere un effetto particolare (come muoversi o sollevarsi). Fondamentalmente, i metodi di adattamento proposti potrebbero occuparsi di compiti diversi senza modifiche. Ad esempio, a seconda dell’effetto che abbiamo chiesto loro di esplorare, potrebbero generare gestione della palla o manipolazione del joystick», afferma il Prof. Doncieux. Incoraggiato da questi esperimenti, il team sta ora lavorando a livello teorico per far luce su alcuni degli elementi costitutivi del loro approccio, come il modo in cui i robot possono scoprire comportamenti pertinenti, quando si sa poco su quali azioni o stati dovrebbero apparire.