Un apprentissage approfondi en profondeur enseigne aux robots de nouvelles compétences plus rapidement que jamais

$config[ads_kvadrat] not found
Anonim

Les robots apprennent à effectuer des tâches dans des mondes virtuels accélérés, développant leurs compétences en quelques heures et pouvant prendre des mois. L’apprentissage par renforcement profond simulé (ou RL profond) désigne une compétence qui prendrait normalement 55 jours pour un I.I. apprendre dans le monde réel ne prend qu'une journée dans la salle de classe hyper-accélérée.

«Nous avons le potentiel de révolutionner ce que nous pouvons faire dans le domaine de la robotique», a déclaré jeudi Raia Hadsell, chercheuse chez Google DeepMind, lors du sommet Re-Work Deep Learning organisé à Londres. "Nous pouvons apprendre des compétences au niveau humain."

Cela peut sembler contre-intuitif, car l’intérêt des robots est que les programmeurs puissent leur apprendre à faire des choses, non? Cependant, lors de la conception d'une machine qui fonctionne dans le monde réel, les robots ont besoin de beaucoup de données pour comprendre comment effectuer une tâche dans une situation inconnue. A.I. pouvez utiliser ces données pour «apprendre» une compétence basée sur toutes les instances précédentes.

L’apprentissage par renforcement en profondeur recueille ces données de la même manière que les humains: un robot exécute une tâche répétitive, comme attraper une balle, et enregistre les données pour créer une image de la meilleure façon d’attraper une balle dans une nouvelle situation. Lorsque DeepMind a utilisé le modèle en 2013 pour enseigner à un robot comment maîtriser les jeux Atari, simplement en l'assoyant devant l'écran et en lui indiquant l'objectif final, la communauté scientifique a adoré.

Le problème est que cela prend une éternité. Vous devez lancer des balles sur un robot à plusieurs reprises ou, dans le cas Atari, laisser le robot seul dans sa chambre à coucher pendant un moment. Exécutant une simulation MuJoCo, associée à un réseau de neurones progressif, les formateurs peuvent exécuter un programme imitant le robot, transférer les comportements appris au robot et cartographier les mouvements virtuels dans le monde réel.

«Nous pouvons faire fonctionner ces simulateurs toute la journée et toute la nuit», a déclaré Hadsell.

Les résultats parlent d'eux-mêmes. Ce robot, qui a obtenu son diplôme en attrape, peut maintenant suivre des balles virtuelles comme si elles étaient réelles, l’amorçant ainsi du grand jour où il est invité à attraper une vraie balle:

$config[ads_kvadrat] not found