Le Big Data est un terme utilisé pour qualifier la collecte, le stockage et l’analyse d’un grand volume de données numériques (textes, photos, vidéos, etc). Comme nous l’avons constaté lors du Salon du Big Data en mars dernier, ce phénomène est en pleine expansion aujourd’hui.
En effet, nous produisons et consommons tous les jours un volume de données de plus en plus important. Ces données sont une source d’informations très riche, car elles reflètent nos envies, nos centres intérêts et parfois même nos opinions. Afin d’anticiper les nouvelles tendances du marché et s’adapter au plus près des besoins des consommateurs, l’analyse des données est donc devenue vitale pour les entreprises. Cela soulève de nombreuses questions éthiques : quel contrôle le citoyen doit-il avoir sur l’utilisation de ses données ? Comment l’informer des mécanismes et décisions prises par les algorithmes ? Peut-il être influencé malgré lui ?
Pour que le monde de demain ne ressemble pas à un épisode de Black Miror, il apparait nécessaire d’encadrer l’expansion du Big Data. Cet article se propose de catégoriser quelques risques éthiques liés au Big Data et d’identifier des solutions qui se mettent en place pour pallier ces risques. Nous finirons sur une note positive en illustrant les opportunités offertes par le Big Data.
Quels sont les risques éthiques liés au BIG DATA ?
Etant donné l’étendue du sujet, il semble difficile d’apporter une réponse exhaustive à cette question. Le Big Data est un phénomène dense qui évolue constamment avec le développement des nouvelles technologies : IoT, Intelligence Artificielle, Machine Learning… Aujourd’hui, il est impossible d’appréhender l’ensemble des impacts qu’auront ces technologies sur le monde de demain. Cependant, nous tacherons au travers d’exemples simples de catégoriser un certain nombre de risques éthiques liés au Big Data.
- Des risques politiques : le scandale Cambridge Analytica illustre parfaitement le lien entre dérives politiques et Big Data. Cambridge Analytica, cabinet de conseil en communication politique, accompagne les hommes politiques dans leurs campagnes grâce à des outils d’analyse des données. La société a notamment accompagné Donal Trump dans sa campagne. Cambridge Analytica est accusée d’avoir utilisé les données personnelles de 87 millions d’utilisateurs de Facebook à leur insu. Bien que la compagnie assure que ces données n’ont pas été analysées dans le cadre de la campagne présidentielle américaine de 2016, le doute plane. Le Big Data peut donc être utilisé afin d’effectuer des campagnes d’influence ciblées pour orienter à son insu l’électeur dans son vote.
- Des risques sociaux : Microsoft a lancé en 2016 une intelligence artificielle (IA) pour interagir avec les adolescents sur les réseaux sociaux. Ce chatbot nommé « Tay » effectue une analyse des données disponibles publiquement sur Twitter pour répondre aux questions des internautes. En à peine 8 heures, Tay, qui a suscité l’intérêt de plus de 23 000 abonnés, est devenu raciste et en est même venu à nier l’existence de l’holocauste. Cette dérive est extrêmement inquiétante étant donné les multiples domaines d’application de l’IA dans l’analyse des données. Par exemple, l’IA est utilisée à des fins militaires dans le développement de robots tueurs autonomes. Ces machines intelligentes analysent leurs environnements et sont capables de prendre des décisions sans intervention humaine. L’ONU a créé un groupe d’experts gouvernementaux sur le sujet pour convaincre un maximum de pays d’interdire ces technologies. Pour l’instant, les nations ne parviennent pas à trouver un accord sur la définition d’une arme mortelle autonome, et le développement des robots tueurs se poursuit sans être réglementé. L’analyse automatique des données grâce une IA évolue donc constamment dans de multiples domaines, dont il est difficile d’anticiper les risques pour nos sociétés de demain.
- Des risques environnementaux : le Big Data impacte de manière non négligeable notre environnement. En effet, le traitement et le stockage d’un grand volume de données consomme une énorme quantité d’énergie. Selon un rapport de Greenpeace publié en 2018, le secteur informatique serait responsable à lui seul de 7 % de la consommation mondiale d’électricité. Ce chiffre n’est pas amené à diminuer : « en 2020, le trafic Internet mondial pourrait avoir triplé », indique Greenpeace dans son rapport, en précisant que le nombre d’utilisateurs à l’échelle mondiale « devrait passer de trois à quatre milliards d’ici à la fin de la décennie ».
Un cadre législatif et des organisations qui s’adaptent progressivement
Les risques éthiques liés au Big Data sont donc nombreux et difficiles à anticiper. Malgré tout, des solutions se mettent en place pour pallier les risques et anticiper les dérives.
L’Europe a mis en place le 25 mai 2018 un Règlement Général sur la Protection des Données (RGPD). Son ambition est d’établir « des règles relatives à la protection des personnes physiques à l’égard du traitement des données à caractère personnel », ainsi que « des règles relatives à la libre circulation de ces données ». L’objectif est clair : protéger « les libertés et droits fondamentaux des personnes physiques, et en particulier leur droit à la protection des données à caractère personnel ». L’article 9 interdit notamment le traitement des données révélant : « l’origine raciale ou ethnique, les opinions politiques, les convictions religieuses ou philosophiques, …, la santé, la vie sexuelle ou l’orientation sexuelle ».
Cependant, la mise en application du RGPD est compliquée et ne garantit pas encore aux citoyens européens la totale maîtrise de leurs données personnelles. En effet, la CNIL (Commission nationale de l’informatique et des libertés) a condamné Google en janvier 2019 à payer une amande de 50 millions d’euros pour ne pas suffisamment informer ses utilisateurs. A la suite de la mise en œuvre du RGPD, les utilisateurs doivent donner leur consentement à l’utilisation de leurs données personnelles. Néanmoins, la CNIL estime qu’ils ne sont « pas en mesure de comprendre l’ampleur des traitements mis en place par Google ». De plus, la CNIL accuse Google d’inciter à « consentir en bloc pour toutes les finalités poursuivies par Google ». Le RGPD n’est donc qu’une première étape : la législation devra continuer d’évoluer pour permettre la mise en pratique de la protection des données personnelles.
En complément des évolutions législatives, les organisations deviennent de plus en plus sensibles aux enjeux éthiques liés au Big Data et aux technologies de l’IA. Des comités d’éthique se créent pour faciliter les prises de décision en anticipant les dérives possibles. Par exemple, Florence Parly, la ministre des Armées, a annoncé en avril dernier la création d’un comité d’éthique au sein de son ministère : « La France sera la première grande puissance militaire à se doter d’une structure permanente de réflexion sur les enjeux éthiques des nouvelles technologies dans le domaine de la défense », a-t-elle déclaré.
Google a également tenté de mettre en place un comité d’éthique dédié à l’usage des données et à l’IA : l’ATEAC (Advanced Technology External Advisory Council). Malheureusement, le choix des membres du comité n’a pas fait l’unanimité au sein de l’entreprise. A la suite d’une pétition signée par de nombreux salariés, l’ATEAC a dû être démantelé une dizaine de jours à peine après sa création. En réponse à cet échec, Google a cependant confirmé sa volonté de trouver « d’autres moyens de recueillir des opinions extérieures sur ces sujets ».
Les nouvelles opportunités offertes par le Big DATA
Le Big Data constitue également un levier considérable au service du bien commun. En effet, de nombreux projets utilisent le Big Data avec pour ambition de diminuer les inégalités ou de favoriser le développement de solutions respectueuses de l’environnement. Voici quelques exemples d’opportunités possibles :
- Des opportunités sociales : le projet OPAL (Open Algorithms) est une parfaite illustration de l’utilisation du Big Data à des fins éthiques. En analysant des données auprès des opérateurs téléphoniques, des banques, des sociétés de distribution d’énergie, etc, OPAL souhaite produire des indicateurs socio-économiques dans les pays en voie de développement. Ainsi, OPAL permettra d’établir un diagnostic fin des besoins des populations et des territoires. Les applications sont multiples en matière de santé, d’éducation, d’agriculture ou encore de transports. Par exemple, en utilisant les statistiques d’appels téléphoniques, OPAL pourra établir des modèles de déplacement des populations et estimer les besoins en transports. Ce projet est soutenu par l’AFD (Agence Française de Développement) à hauteur de 1,5 millions d’euros. Il est actuellement en phase pilote au Sénégal et en Colombie, en partenariat avec des agences de statistiques et des opérateurs téléphoniques locaux.
- Des opportunités écologiques : le Big Data peut également être utilisé pour optimiser les consommations d’énergie. Par exemple, en captant les données de ses datas centers, Google affirme améliorer l’efficacité énergétique des serveurs. En effet, en analysant grâce une IA les températures intérieures et extérieures, l’évolution des puissances consommées et les activités des machines au fil du temps, Google avance un gain d’efficacité de 40% des systèmes de refroidissement. D’autres projets sont en cours, comme celui de la start-up toulousaine MeteoSwift, qui propose d’utiliser le Big Data et l’IA pour optimiser la gestion de l’intermittence des énergies renouvelables. Elle s’engage auprès de ses clients à « faciliter les prises de décisions en mettant à disposition une palette de services de prévisions de production et de gestion des risques ». MeteoSwift compte notamment Enedis parmi ses clients. La start-up a reçu de nombreux prix, tel que le label du MIT « Innovators under 35 Europe » en 2017, récompensant les 35 plus grands innovateurs en Europe.
Ainsi, le Big Data est au cœur des transformations de nos sociétés. Il touche l’ensemble des secteurs d’activités et ses enjeux sont multiples : politique, économique, environnemental, etc. Si le Big Data est à l’origine de nombreuses dérives, il représente également une formidable opportunité pour bâtir notre monde de demain. C’est pourquoi il est nécessaire d’encadrer son développement pour garantir une exploitation sécurisée et éthique des données.