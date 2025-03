Microsoft s’attèle à un défi de taille : rendre visible et mesurable l’apport des créateurs de contenus aux modèles d’intelligence artificielle.

Tl;dr Microsoft développe un projet pour rendre l’origine des données utilisées par ses IA plus transparente.

L’objectif est de reconnaître et rémunérer les contributeurs des données qui influencent les créations générées.

Ce projet répond à des enjeux juridiques et éthiques, notamment autour des droits d’auteur et des régulations futures.

Vers une IA plus transparente et responsable

Microsoft cherche à rendre les modèles d’IA plus transparents quant à leurs sources d’inspiration. Un projet de recherche, révélé dans une offre de stage diffusée en décembre, vise à évaluer l’impact précis de certaines données d’entraînement, comme des photos ou des livres, sur les créations générées par IA. Actuellement, les architectures des réseaux neuronaux sont opaques, empêchant de retracer les origines des contenus produits. Microsoft souhaite inverser cette tendance afin de mieux reconnaître, voire rémunérer, les personnes ayant contribué des données précieuses. Une telle initiative pourrait inciter davantage de créateurs à partager leurs œuvres. C’est aussi une réponse potentielle aux défis éthiques et juridiques que posent ces technologies.

Les enjeux juridiques autour de l’utilisation des données

Les modèles génératifs de texte, d’image ou de code sont actuellement au cœur de nombreux procès liés aux droits d’auteur. Microsoft est lui-même visé par plusieurs actions en justice, notamment par The New York Times, qui l’accuse, avec OpenAI, d’avoir enfreint ses droits en utilisant ses articles pour entraîner leurs modèles. Des développeurs reprochent aussi à GitHub Copilot d’avoir exploité leurs codes sans autorisation. Ces affaires mettent en lumière les pratiques contestées de collecte massive de données sur Internet, parfois sans respecter les droits des auteurs. Si certains invoquent le « fair use », de nombreux créateurs estiment que leurs œuvres sont utilisées sans consentement ni compensation. Microsoft semble ainsi chercher à anticiper d’éventuelles régulations contraignantes.

Le concept de « dignité des données » défendu par Jaron Lanier

Jaron Lanier, chercheur influent chez Microsoft, participe à ce projet sous le nom de « training-time provenance ». Lanier promeut la notion de « dignité des données », qu’il décrit comme un moyen de relier les créations numériques à leurs auteurs humains. Il imagine un système capable d’identifier les contributeurs essentiels à une production IA spécifique. Par exemple, une demande d’animation mettant en scène des enfants dans un monde de chats parlants pourrait reconnaître l’apport de certains peintres, auteurs ou doubleurs, vivants ou non. À terme, ces contributeurs pourraient recevoir reconnaissance et rémunération. Ce modèle vise à encourager une IA plus éthique, respectueuse du travail créatif humain.

Un projet qui pourrait rester symbolique, mais qui fait débat

Malgré ces intentions, certains restent sceptiques quant à l’impact réel du projet de Microsoft. De précédents engagements d’autres entreprises, comme OpenAI, sur des outils de gestion des droits d’auteur n’ont pas encore abouti. De plus, certains y voient une stratégie pour redorer l’image éthique de Microsoft face à la montée des critiques et aux actions judiciaires. Néanmoins, la démarche se distingue dans un contexte où d’autres grands acteurs, comme Google, militent pour un assouplissement du droit d’auteur afin de faciliter l’entraînement des IA. Si Microsoft parvient à concrétiser ce projet, cela pourrait marquer un tournant dans la reconnaissance et la rémunération des créateurs à l’ère de l’intelligence artificielle.