Le 10 septembre dernier, nous nous donnions rendez-vous au Palais des Congrès à Nantes pour la quatrième édition du Salon de la Data co-organisée cette année par IGN, DACTA, Polydata et le bureau nantais de Wavestone.
Sur place, 30 stands tenus par des professionnels du secteur et 53 conférences thématiques animées par des experts et personnalités publiques, balayant l’ensemble des sujets d’actualité du secteur : standardisation de la data, industrialisation des solutions data centric, interopérabilité, IA, révolution IoT, Smart City, gouvernance, formation, transformation des métiers, sécurité, RGPD…
Parmi les exposants, on trouve de nombreux intégrateurs de solutions de data analyse et plusieurs cabinets de conseil et grands groupes présentant leurs offres et innovations. Au centre de l’allée principale, Creabrick nous présente quelques jeux d’innovation suscitant intérêt et amusement. Parmi ces-derniers, une machine en lego nourrie à l’IA capable de résoudre un Rubiks Cube en moins de 80 secondes, pourtant bien mélangé..
En combien de temps le rubicks’ cube sera-t-il résolu ?#SalonData2019 #IA pic.twitter.com/aY6FlzwUJn
— DigitalCorner (@Digi_Corner) September 10, 2019
Après avoir cheminé à travers le salon et assisté aux premières conférences, on se rend vite compte que le sujet data a bien avancé dans les entreprises, qu’il ne relève plus d’innovations en marge ou de POC mais que se sont désormais les problématiques de passage à l’échelle, d’usages, de retour sur investissement, de gouvernance et de sécurité qui prédominent. Les acteurs concernés par le sujet de la data sont de plus en plus nombreux et diverses ; la thématique du Smart Territoire place à la fois les collectivités locales, les entreprises et la société civile au cœur des débats alors que l’entrée en vigueur du RGPD a renforcé la présence de l’Europe et de l’Etat sur le sujet.
POUR LES ENTREPRISES, LA QUESTION DE L’INDUSTRIALISATION DE LA DATA EST CENTRALE
Ces dernières années ont été marquées par le lancement de projets data dans une grande majorité d’entreprises. Elles se sont, d’une part, mises à capter et stocker le plus de données possibles (données clients, données de fonctionnement…), et ont d’autre part développé un certain nombre de POC. Aujourd’hui, l’enjeu est le passage à l’échelle de ces projets data centric afin que ces nouvelles solutions soient porteuses de performance pour l’entreprise.
Un exemple de projet d’industrialisation de la data nous est présenté par Sinbad Belili et Nicolas Dupont d’U Iris, l’entité informatique du groupement U et Matthieu Forner, senior consultant chez Wavestone qui a accompagné U Iris dans son projet EDH (Entreprise Data Hub) depuis 2016. La salle comble témoigne de l’intérêt pour ce type de problématique.
Les cas d’usage du projet EDH chez groupement U sont emblématiques du secteur du retail : exploitation des données clients afin de mieux le connaître, optimisation de la logistique et des opérations à l’aide des données des entrepôts et enfin, utilisation des données du magasin en vue de préconiser de meilleurs assortiments de produits.
Pour pouvoir industrialiser ce type de solutions, la capacité à capter et stocker la data et la maîtrise de l’architecture sont des prérequis techniques. De fait, il s’agit du socle de structuration pour ensuite mettre en place des solutions de traitement, d’analyse et de restitution de la donnée. C’est aussi à ce moment que se pose la question du stockage et du traitement sur le cloud ou dans son propre data center. Les étapes suivantes sont le développement et le test de plusieurs POC pour sélectionner seulement ceux qui génèrent de la valeur. Le projet d’industrialisation est mené en mode agile afin de pouvoir délivrer de la valeur rapidement et tout le temps tout en gagnant en sérénité opérationnelle ; l’efficacité passe aussi par le fait que les outils doivent être le plus vite possible dans les mains du métier.
Sur le chemin de l’industrialisation viennent aussi se poser des questions plus larges, de gouvernance, de conformité au RGPD et de transformation des métiers, cependant, la première exigence reste celle d’identifier les usages data porteurs de création de valeur.
LA CONNAISSANCE DU CLIENT EN FIGURE DE PROUE DES USAGES DATA
L’enjeu de la connaissance client est au centre de toutes les attentions. Sa production de données est partout : en magasin, sur les sites de e-commerce, sur les réseaux sociaux… et l’enjeu de l’ère data pour les entreprises est la « réconciliation » client, c’est-à-dire la capacité à unifier tous les achats et interactions d’un client sous un même profil, quelques soient les canaux utilisés.
Dans une étude menée auprès de 602 dirigeants dans les domaines de l’assurance, de l’industrie et de la distribution début 2019, Benoît Durand et Maximilien Moulin, managers chez Wavestone, ont identifié la connaissance client comme étant la première raison de mise en place de projets data chez ces entreprises.
Cette problématique, nous l’avons retrouvée à la fois dans le projet EDH d’U Iris présenté précédemment mais également lors d’une conférence animée par Virgile Coste responsable data Science chez Maisons du Monde. Le grand chantier data mené par Maisons du Monde est centré sur la compréhension des comportements d’achat de ses clients, notamment de l’effet « REPO » (Research Online, Purchase Offline). L’entreprise aborde en effet les achats web mais aussi magasin, l’enjeu étant la compréhension omnicanale des achats avec une opposition entre une donnée web facile à collecter car déjà structurée et très souvent associée à un compte client et la donnée magasin plus difficile à traiter. Maisons du Monde travaille d’une part sur un volet de corrélation entre produits vendus à l’aide d’une matrice de corrélation en vue de proposer un bloc de recommandations d’achat pertinent aux clients et d’autre part la compréhension de la Customer Lifetime Value avec les données d’achats, de fréquence et de durée de la relation afin de mieux segmenter la clientèle et de pouvoir lui adresser des offres plus personnalisées.
L’utilisateur produit des données lorsqu’il est client mais également lors de son interaction avec d’autres utilisateurs, avec les collectivités locales, lors de ses déplacements, de sa consommation d’énergie ou de son occupation d’un bâtiment. Ainsi, la volonté d’exploiter les données de la ville et du territoire est au cœur d’un autre type de projet mis en valeur lors de ce salon. La variété des données et la multiplicité des acteurs concernés font de l’organisation de la donnée un vrai défi.
L’ORGANISATION DE LA DATA, CLE DU SUCCES D’UN PROJET DE SMART TERRITOIRE
La Smart City et le Smart Territoire sont mis à l’honneur lors du Salon de la Data, notamment à travers le retour sur le projet angevin de Smart Territoire exposé par Jacques Pouvreau, DSI d’Angers Loire Métropole et Thomas Emereau, Manager Secteur Public chez Wavestone. La donnée produite par l’usager est riche et multi-sources : par exemple les collectivités ont accès aux données d’urbanisme, de population, d’éducation, de tourisme ; les sociétés de transports accèdent aux données de flux de personnes ; les fournisseurs d’énergie à celles de consommation ; certains acteurs digitaux comme Waze concentrent des données d’état de la voirie, du trafic routier ; et la mise en place de capteurs IoT permet de capter des données directement sur le terrain. Outre la prise de conscience de la richesse de ces données qui sont « le carburant de la ville de demain », le principal enjeu d’une démarche de Smart Territoire est l’organisation autour de la donnée. Pour cela, la première étape est l’établissement d’un socle comprenant outillages SI, infrastructures urbaines, premiers usages et services. La définition d’une organisation data doit être traitée en parallèle ; dans le cas du projet angevin, les rôles de la gouvernance ont été répartis dans 3 grandes catégories : bureau du management de la donnée, SI (architecture et sécurité des données), métier (analyse et contrôle). Enfin, il est primordial de placer l’utilisateur au centre du développement des usages du territoire intelligent à la fois dans la définition des thématiques prioritaires (mobilité, énergie et habitat, environnement, sécurité urbaine dans le cas du projet angevin) et à travers l’encouragement d’initiatives des habitants.
De ce salon, nous tirons trois tendances :
- Les projets data se complexifient, leur périmètre s’élargit et les parties prenantes sont de plus en plus nombreuses et diverses. En conséquence, la compréhension de ces projets demande des connaissances à la fois techniques et architecturales, et des notions de sécurité et de gouvernance.
- Les métiers de la data évoluent et s’affinent, le métier de data scientist se décline aujourd’hui en au moins une dizaine de nouveaux métiers. De plus en plus de personnes devront à l’avenir manipuler de la data, et ce à tout niveau de qualification.
- La formation devient donc un enjeu majeur, pour des collaborateurs déjà sur le marché du travail mais aussi pour des étudiants futurs diplômés afin d’anticiper et prévoir les besoins métiers dans 10 ans.