L'intelligence artificielle (ou IA) est la clé de voûte de nombreuses applications dans notre monde connecté, notamment dans les domaines de la réalité augmentée et la réalité virtuelle. Pour entraîner ses systèmes de reconnaissance visuelle, Facebook utilise les milliards d'images publiques présentes sur le net, en particulier Instagram.

Depuis l'affaire Cambridge Analytica, la protection des utilisateurs de Facebook est (du moins l'affirme-t-elle) au centre des préoccupations de la firme. Celle-ci doit affronter continuellement des problèmes de fausses informations, d'injures et de contenus non adaptés. La mission de Facebook est donc énorme : trier les informations présentes sur ses différents services. Ici, on parle de millions de commentaires, d'images qui sont postés chaque jour. Pour traiter ce gigantesque flux d'informations, Facebook a naturellement recours à l'intelligence artificielle. C'est la fondation de nombreuses applications et notamment celles qui s'occupent de vérifier le contenu du réseau social.

Si Facebook attendait auparavant des remontées d'informations pour traiter les contenus à problème, ce sont désormais des systèmes dits “intelligents” qui traquent le moindre détail pouvant nuire aux utilisateurs du réseau social. Pour cela, il faut entraîner les systèmes à comprendre leur environnement et donc les nourrir avec des informations documentées. Pour les images, il existe déjà des bases de données décrites par des humains comme ImageNet. Lors de la conférence F8, Mike Schroepfer a montré comment l'entreprise utilise les images d'Instagram pour documenter ses systèmes. Pourquoi ? Parce que les utilisateurs d'Instagram ajoutent des hashtags, libellés qui permettent de décrire les images postées sur Instagram. Le responsable technique de Facebook indique ainsi utiliser plus de 3,5 milliards d'images pour rendre ses systèmes de plus en plus malins et pertinents, alors que les autres systèmes utilisent seulement des millions d'images.

Avec un tel réservoir d'informations, le système de Facebook serait 1 à 2 % plus précis que les autres, ce qui pourrait sembler bien faible au vu de la montagne de données supplémentaires traitées. Ceci étant, la base de données est croissante et le système devrait s'améliorer, ce n'est qu'une question de temps.

L'intervention de Mike Schroepfer à la conférence F8 2018 de Facebook

Lire aussi…

Renaud Labracherie
Renaud Labracherie

Rédacteur en chef de Focus Numérique. Grand évangéliste du RAW. Ses publications