Pourquoi A.I. Peut lutter pour comprendre l'arabe

$config[ads_kvadrat] not found

Comprendre la peine de mort avec Nota Bene

Comprendre la peine de mort avec Nota Bene
Anonim

Dans le monde de l'intelligence artificielle, les données sont roi. Plus vous en avez, plus vos outils deviennent performants, car les systèmes peuvent en «apprendre» plus sur ce à quoi s'attendre. Mais en fonction de la plate-forme, le A.I. D'après Miriam Redi, chercheuse chez Yahoo Labs, certaines langues sont peut-être mieux représentées que d'autres.

"Par exemple, comme Flickr, où nous prenons nos données, certaines langues sont très peu représentées", a déclaré Redi, prenant la parole lors du Deep Learning Summit de Londres, jeudi. “Nous avons donc l'anglais, des millions d'images pour l'anglais, mais nous en avons peut-être 100 000 pour l'arabe.”

L’équipe de Redi travaille sur un outil capable d’identifier des éléments non visibles dans les images, tels que les valeurs culturelles et les connotations émotionnelles. L'outil analyse le texte joint aux images accessibles au public sur Flickr. Au fil du temps, le A.I. commence à comprendre pourquoi une personne peut qualifier une image de «fête joyeuse» ou de «moment inconfortable», mais ces idées deviendront de plus en plus précises à mesure que l'outil analyse davantage d'images.

"Malheureusement, la précision de la détection des sentiments dans les images pour les langues arabes a tendance à être inférieure, car nous ne disposons pas de suffisamment de données", a déclaré Redi.

Dans les langues contenant de plus grandes quantités de données, l’équipe de Redi a remarqué quelques tendances intéressantes. Les langues romanes telles que le français et l'espagnol ont tendance à s'exprimer de la même manière, tandis que l'italien semble être la seule langue où les utilisateurs identifient les images avec le terme «fraude fiscale».

Les barrières linguistiques restent un problème pour A.I. des chercheurs. Quiconque utilise Google Translate saura que changer de langue n’est jamais aussi simple que cela en a l'air. Toutefois, les nouveaux développements changent les choses. Facebook a annoncé cet été qu'il se rapprochait de son rêve d'un réseau social monolingue, traduisant automatiquement les textes pour les utilisateurs.

Les progrès dans la suppression des barrières linguistiques peuvent aider à favoriser la communication internationale, mais pour des projets comme Redi, il n’ya pas de véritable substitut aux données de sentiment générées par l’homme.

$config[ads_kvadrat] not found