Tl;dr Slack utilise les messages des utilisateurs pour entraîner ses modèles de machine learning sans permission explicite.

Cette pratique est révélée par défaut et nécessite une démarche de désinscription active.

En dépit des préoccupations, Slack précise que ces données sont utilisées, non pour l’IA générative, mais pour les recommandations de canaux et d’émoticônes.

Ce fait soulève des questions sur la politique de confidentialité de Slack et son interprétation.

Exploitation des données privées : une pratique banalisée

Qui sont les utilisateurs de Slack ? La réponse n’est pas aussi simple que l’on pourrait le croire. En effet, Slack s’arroge le droit d’exploiter sans consentement préalable les messages, les fichiers et autres contenus partagés par ses utilisateurs pour peaufiner ses modèles de machine learning. Une pratique d’opt-out est mise en place, permettant aux utilisateurs de se désinscrire, mais par défaut, leurs données privées sont déjà exploitées. La procédure de désinscription, quant à elle, laisse à désirer puisqu’elle exige de l’utilisateur de solliciter lui-même le service client de Slack pour que cesse cette utilisation de ses données.

Le paradoxe de la politique de confidentialité de Slack

L’ironie de cette affaire réside dans le fait qu’une telle pratique est explicitement mentionnée dans les principes de confidentialité de Slack. C’est du moins ce qu’a repéré Corey Quinn, un cadre de DuckBill Group, qui a partagé cette information sur X (via PCMag). Selon un extrait de ces principes (et c’est lui qui souligne) : “Pour développer des modèles AI/ML, nos systèmes analysent les données des clients“, et c’est précisément là que s’inscrit le paradoxe.

I'm sorry Slack, you're doing fucking WHAT with user DMs, messages, files, etc? I'm positive I'm not reading this correctly. pic.twitter.com/6ORZNS2RxC — Corey Quinn (@QuinnyPig) May 16, 2024

En réponse aux diverses préoccupations soulevées par cette utilisation inédite des données, Slack a publié un billet de blog dans lequel on peut lire que ces données sont utilisées pour ses modèles de machine learning, à des fins par exemple de recommandations de canaux ou d’emoji, et non pour l’IA générative. La société prétend ne pas utiliser les données de contenu des messages dans ses modèles traditionnels de machine learning, qu’il s’agisse de messages directs, de canaux privés ou publics.

Face à tout cela, une question s’impose : à quel point Slack est-elle transparente sur sa politique de confidentialité et sur l’utilisation des données privées des usagers ? Cette question reste pendante alors que Slack continue de faire la promotion de ses outils d’IA générative premium en assurant : “Votre donnée est votre donnée. Nous ne l’utilisons pas pour entraîner l’IA de Slack“, et que dans le même temps, elle admet utiliser les données privées pour affiner certains de ses modèles de machine learning. Une contradiction manifeste, qui laisse planer un doute sur l’interprétation de sa politique de confidentialité.