#Débatech : Anonymisation des données dans le retail : enjeu RSE ou risque financier?

Bienvenue dans la série d’articles « Débatech », dans laquelle nous présentons nos pistes de réflexions sur des thématiques en lien avec la tech et retail. Notre ambition ? Partager nos constats et nos découvertes pour faire avancer le débat public. Notre auteur de ce mois-ci est Max Barbet, cofondateur de YOUrban. Avec son expérience en sciences de l’information EPITECH, il propose ici une perspective unique sur un débat polémique : les données personnelles. Dans cette article, vous découvrirez à travers son regard, sa vision des problématiques auxquelles sont confrontés les géants du retail ainsi que ses idées de solutions. Sans plus attendre, découvrez l’article de Max Barbet, dans Débatech.

Photographie d’ Ivan

L’utilisation des données personnelles pour le marketing et l’analyse de données est devenue pratique courante ces dernières années. Au-delà de l’engouement pour les perspectives que cette utilisation incarne en termes de performance marketing, cela a également suscité de nombreuses controverses, notamment sur la protection de la vie privée.

En réponse à ces préoccupations, l’anonymisation des données a alors émergé comme solution protectrice de l’identité des utilisateurs, mais qu’en est-il véritablement ?

L’anonymisation des données, un enjeu primordial pour les entreprises ?

L’anonymisation des données est fréquemment utilisée pour protéger la vie privée des utilisateurs. Cependant, l’usage de données anonymisées conservent-elles leur performance ? Quel est l’impact de cette anonymisation ?

L’anonymisation, risque ou opportunité RSE pour l’entreprise ?

L’anonymisation des données peut être considérée comme une solution viable pour protéger la vie privée tout en permettant aux entreprises d’améliorer leurs performances marketing et commerciales. Néanmoins, il est vrai que dans certaines conditions, elle peut également entraîner une perte de précision et de pertinence – en particulier si les données sont utilisées pour entraîner des modèles prédictifs sur des profils types de clients.

Il faut donc garder en tête, qu’avant d’entamer toute démarche, il est nécessaire de bien déterminer les objectifs des algorithmes et méthodes nécessitant ces données, pour minimiser les risques de pertes de précision et de pertinence.

L’anonymisation, une solution viable qui a déjà prouvé pouvoir allier éthique et performance

Ce risque peut considérablement varier selon l’algorithme utilisé et les données sur lesquelles il est appliqué.

On peut prendre pour exemple l’étude « An Efficient Big Data Anonymization Algorithm Based on Chaos and Perturbation Techniques » par C. Eyupoglu, M. Aydin, A. Zaim et A. Sertbas témoigne des enjeux de la sécurité des données personnelles quand elles sont liées au Big Data.

Dans cette étude, un algorithme d’anonymisation des données établi sur le chaos et la perturbation a été proposé pour préserver la confidentialité et l’utilité des données volumineuses.

Les performances de l’algorithme proposé sont ensuite évaluées en termes de divergence de Kullback-Leibler, d’anonymat probabiliste, de précision de classification, et de temps d’exécution.

Les résultats expérimentaux ont montré que l’algorithme proposé est efficace et donne de meilleurs résultats en termes de divergence de Kullback-Leibler, et précision de classification par rapport à la plupart des algorithmes existants utilisant le même ensemble de données.

Conclusion : Résultant de l’application du chaos pour perturber les données, cet algorithme réussi est prometteur pour être utilisé dans l’exploration de données et permet d’harmoniser éthique et confidentialité.

Peut-on concevoir des modèles simplifiés, qui allient anonymisation des données et performance ?

Sur le plan purement technique, il est également possible de concevoir des modèles fonctionnant avec des caractéristiques moyennes représentatives d’un groupe (ou « persona ») plutôt qu’avec une moyenne de caractéristiques précises récupérées en ligne.

Ensuite, il est nécessaire de prendre en compte la gestion stratégique du changement qu’impose cette stratégie : il faut absolument former les collaborateurs à ces choix stratégiques afin de les rassurer sur le maintien de la performance.

 

Photographie de Tima Miroshnichenko

Quelle stratégie mettre en place pour allier RSE, performance et RGPD ?

Outre le recrutement d’un profil technique sensibilisé aux questions RGPD et de performance algorithmique, il est fondamental de se former de manière autonome à ces enjeux en lisant de la littérature sur le sujet.

Voici quelques-unes de mes recommandations de lecture :

Recommandation n°1 : « Business Intelligence and Analytics: From Big Data to Big Impact » by Hsinchun Chen, Roger H. L. Chiang and Veda C. Storey

Mots clés : big data, business intelligence, aide à la décision

Cette étude explore les tendances et les défis de l’analyse de données dans le contexte de la gestion de données massives (ou « big data »). Elle examine comment les entreprises peuvent tirer parti de ces données pour améliorer leur performance et prendre de meilleures décisions grâce à l’analyse de données.

Recommandation n°2 :« Data privacy and security in business intelligence and analytics » by Delgado Mercè, Jaime.

Mots clés : RGPD, cybersécurité, business intelligence, data science

Cette étude explore les enjeux de la protection de la vie privée et de la sécurité des données et de l’analyse de données. Elle examine les risques liés à l’utilisation de données personnelles et les méthodes qui peuvent être utilisées pour protéger la vie privée et la sécurité des données, telles que l’anonymisation des données et la gestion des droits d’accès.

Recommandation n°3 : « Business intelligence meets big data : an overview on security and privacy » by C.A. Ardagna and E. Damiani

Mots clés : big data, sécurité, protection de la vie privée, business intelligence, cyber-sécurité

L’étude « Business Intelligence Meets Big Data: An Overview on Security and Privacy » de C.A. Ardagna et E. Damiani explore les enjeux de la sécurité et de la protection de la vie privée dans le contexte de la gestion de données massives (ou « big data ») et de l’utilisation de la Business Intelligence. Elle examine les risques liés à l’utilisation de données personnelles et les méthodes qui peuvent être utilisées pour protéger la vie privée et la sécurité des données, telles que l’anonymisation des données et la gestion des droits d’accès. L’étude présente également une revue de littérature sur les principales approches de sécurité et de protection de la vie privée utilisées dans le domaine de la Business Intelligence et de l’analyse de données.

Précision et performance sont-ils forcément liés ?

Il ne faut pas confondre performance et précision : si les données personnelles peuvent apporter des précisions sur des profils types, elles ne permettent pas forcément d’améliorer les résultats commerciaux.

L’exemple du retail est particulièrement parlant : pour améliorer ses ventes, il ne s’agit pas de comprendre les attentes de plusieurs individus isolés. Il s’agit surtout d’identifier le dénominateur commun qui permettra de toucher une large cible de client et d’atteindre ses objectifs de croissance.


Photographie de Lucas Pezeta

Ainsi, il est important de veiller à condamner la croyance commune qui consiste à associer pertinence pour l’entreprise et précision sur les données clients. On peut tout à fait atteindre une performance maximale, en minimisant la récupération d’informations personnelles !

Le mot de la fin

Chez YOUrban, nous croyons fermement au respect de la vie privée. C’est pour cela que la performance de nos modèles technologiques ne dépendent pas des données personnelles. Toutes nos données sont anonymisées, de A à Z.

Cet article ne représente en aucun cas un état de l’art complet sur le sujet. Il vise cependant à ouvrir de premières pistes de réflexion pour les entreprises ambitieuses qui souhaitent placer la protection de la donnée client au cœur de leur transition numérique !

MINIBIO

Max Barbet travaille depuis 4 ans dans la tech à impact : développement web, analyse de données, intelligence artificielle, architecture Saas, Max est un véritable couteau suisse.. Aujourd’hui, sa mission est de donner vie à l’ambition de YOUrban : Relancer le retail, grâce à la puissance de la data.

Pour cela, il étudie de nombreuses sources de données, compare les formats pour choisir les plus pertinents, et suit le développement technique avec la volonté d’associer deux maîtres-mots : éthique et performance. Il nous partage dans cet article, des pistes de réflexion par rapport à leur utilisation.

https://go-yourban.com