L’équipe IA de NVIDIA aurait illégalement collecté des vidéos de YouTube et Netflix
YouTube a réaffirmé à Engadget que la pratique du scraping représente une "violation flagrante" de ses conditions d'utilisation.
TL;DR
- NVIDIA est soupçonné d’avoir extrait du contenu protégé par des droits d’auteur pour la formation IA.
- La société a défendu ses pratiques, affirmant qu’elle était en conformité avec la loi sur le droit d’auteur.
- Des préoccupations éthiques et juridiques ont été soulevées à l’interne concernant ces pratiques.
Accusations d’infraction aux droits d’auteur par NVIDIA
Dans ce qui semble être une inquiétante récurrence dans le secteur technologique, l’entreprise NVIDIA se retrouve au cœur de polémiques pour avoir, semble-t-il, exploité des trésors d’informations protégées par le droit d’auteur pour la formation de l’Intelligence Artificielle. Il a été rapporté que cette entreprise d’une valeur de 2,4 trillions de dollars, a demandé à ses employés de télécharger des vidéos de YouTube, de Netflix et d’autres bases de données pour développer leurs projets commerciaux d’IA.
Le train de l’innovation ignore-t-il les règles du droit d’auteur ?
Parmi les projets en cours de réalisation, on retrouve le générateur de mondes 3D Omniverse, des systèmes de conduite automatique et des efforts de création d' »humains numériques ». Malgré ces accusations, NVIDIA a pris position, déclarant dans un e-mail à Engadget que ses activités de recherche sont « en pleine conformité avec la lettre et l’esprit de la loi sur le droit d’auteur« , tout en arguant que les lois de propriété intellectuelle protègent des expressions spécifiques « mais pas des faits, des idées, des données ou des informations ». La société a assimilé sa pratique à l’apprentissage et la transmission d’idées.
Cependant, YouTube ne semble pas partager cette vision. Le porte-parole, Jack Malon, a renvoyé aux déclarations de Neal Mohan, le PDG de YouTube, faites en avril dernier, qui stipulaient que l’utilisation de YouTube pour former des modèles d’IA constituait une « violation claire » de ses conditions d’utilisation.
Des voix s’élèvent au sein même de NVIDIA
Des employés de NVIDIA qui ont exprimé des préoccupations éthiques et juridiques sur la pratique ont été informés par leurs gestionnaires que celle-ci avait été approuvée par les plus hauts niveaux de l’entreprise. Cependant, certains ont décrit cette exploitation de données comme une « question juridique ouverte » qui serait abordée ultérieurement.
Des pratiques jugées éthiquement discutables
Outre les vidéos de YouTube et de Netflix, NVIDIA a supposément demandé à ses employés de s’entrainer sur la base de données de bandes-annonces de films MovieNet, sur des bibliothèques internes de séquences de jeux vidéo et sur des bases de données vidéo de Github. Certaines des données sur lesquelles NVIDIA aurait travaillé étaient uniquement marquées comme éligibles à une utilisation académique (ou autrement non commerciale). Malgré cela, NVIDIA aurait ignoré les préoccupations concernant les règles limitées à l’utilisation académique, insistant sur le fait que leurs lots étaient équitables pour ses produits IA commerciaux.
Pour éviter les détections de YouTube, des rapports indiquent que NVIDIA aurait téléchargé du contenu en utilisant des machines virtuelles avec des adresses IP rotatives pour éviter les interdictions.