Le réseau de neurones "surhumains" de Google peut-il vraiment indiquer l'emplacement d'une image?

$config[ads_kvadrat] not found

Le R ft Beux - Billie Jean (Clip officiel)

Le R ft Beux - Billie Jean (Clip officiel)
Anonim

La recherche d'images est plus facile que jamais. Mais si vous essayez de trouver une image de quelque chose qui ne soit pas totalement évident (donc pas les pyramides égyptiennes ni la sculpture géante du pouce à Paris), c'est plus difficile que vous ne le pensez - même avec les informations de géolocalisation basées sur ce qui est dans l'image.

Entrez ingénieur Google nommé Tobias Weyand et une paire de ses collègues. Selon un nouvel article dans le journal arXiv (prononcé «archive»), le trio a construit une machine à apprendre en profondeur capable de localiser la quasi-totalité des photos en se basant uniquement sur l’analyse de ses pixels.

Pour qu'une machine puisse accomplir avec succès une tâche telle que celle-ci, vous voulez lui donner la possibilité de deviner intuitivement des informations basées sur des indices visuels. Vous voulez qu'il pense, en d'autres termes, comme un être humain.

Weyand a entrepris de développer un réseau de neurones artificiels - un système de machine conçu pour imiter les voies neurologiques du cerveau, ce qui lui permet d’apprendre, de traiter et de rappeler des informations comme un humain. Ce nouveau système, PlaNet, est apparemment capable de surpasser les performances de l’homme dans la détermination des emplacements des images, quel que soit le réglage, qu’il soit à l’intérieur ou à l’extérieur, et comportant tout type de repères visuels uniques ou indescriptibles.

Comment fonctionne PlaNet? Weyand et son équipe ont divisé une carte du monde en une grille représentant 26 000 formes carrées dans différentes régions, en fonction du nombre d'images prises à ces endroits. Les endroits denses où de nombreuses photos sont prises tiennent dans un carré plus petit, tandis que les régions les plus grandes et les plus éloignées peuvent être découpées en carrés plus grands.

L'équipe a ensuite créé une vaste base de données d'images déjà géolocalisées, soit près de 126 millions de photos différentes. Environ 91 millions ont été utilisés comme un ensemble de données pour apprendre à PlaNet comment déterminer quelle image pourrait être placée dans quelle grille sur la carte du monde.

Ensuite, le réseau de neurones a été chargé de géolocaliser les 34 millions d’images restantes de la base de données. Enfin, PlaNet a été défini sur un ensemble de données de 2,3 millions d'images géolocalisées de Flickr.

Les resultats? PlaNet pourrait déterminer le pays d'origine pour 28,4% des photos et le continent pour 48%. En outre, le système pourrait localiser 3,6% des images Flickr au niveau de la rue et 10,1% au niveau de la ville.

Et PlaNet est meilleur à cet égard que la plupart des êtres humains - même les plus grands globetrotters. Weyand a recruté 10 personnes bien voyagées pour affronter PlaNet dans un jeu d'étiquetage des emplacements des images trouvées sur Google Street View.

"Au total, PlaNet a remporté 28 des 50 manches avec une erreur de localisation médiane de 1131,7 km, tandis que l'erreur de localisation humaine médiane était de 2320,75 km", ont écrit les chercheurs. «Cette expérience à petite échelle montre que PlaNet atteint des performances surhumaines dans le cadre de la géolocalisation de scènes Street View.»

Est ce réel? Un ingénieur de Google a-t-il vraiment développé un «surhumain» A.I. système?

Peut-être qu’il s’agit de géolocaliser des images. Et ce n’est pas très surprenant - le point de A.I. pas fondamentalement imiter le cerveau humain de toutes les manières, mais dépasser les limitations humaines de quelques manières spécifiques pour accomplir des tâches beaucoup plus difficiles. Donc, dans ce sens, ce que les chercheurs écrivent est vrai.

Néanmoins, il est difficile d’appeler PlaNet un «réseau de neurones». Une forme idéale de ce type de technologie serait capable d’apprendre beaucoup plus que la géolocalisation d’images. A.I. les systèmes sont capables d'écrire des comparaisons et de jouer Super mario, mais il s’agit d’un petit système comparé à un système «maître» idéal, capable de surveiller et de maintenir automatiquement les fonctions vitales, de gérer les infrastructures de transport ou d’énergie, et bien plus encore.

$config[ads_kvadrat] not found