Alors que les chefs d’entreprise cherchent à tirer le meilleur parti de leurs investissements dans l’analyse, la science des données démocratisée semble souvent offrir la solution parfaite. L’utilisation d’un logiciel d’analyse avec des outils sans code et à faible code peut mettre les techniques de science des données entre les mains de pratiquement n’importe qui. Dans les meilleurs scénarios, cela conduit à une meilleure prise de décision et à une plus grande autonomie et libre-service dans l’analyse des données, en particulier lorsque la demande de data scientists dépasse de loin leur offre. Ajoutez à cela des coûts de talents réduits (avec moins de spécialistes des données à coût élevé) et une personnalisation plus évolutive pour adapter les analyses aux besoins et au contexte spécifiques de l’entreprise.

Cependant, au milieu de toutes les discussions sur l’opportunité et la manière de démocratiser la science des données et l’analyse, un point crucial a été négligé. La conversation doit être définie quand démocratiser les données et les analyses, au point même de redéfinir ce que la démocratisation devrait signifier.

La science et l’analyse des données entièrement démocratisées présentent de nombreux risques. Comme écrit par Reid Blackman et Tamara Sipes va article récentla science des données est difficile, et un “expert” non formé ne peut pas nécessairement résoudre des problèmes difficiles, même avec un bon logiciel. Le simple fait de cliquer sur un bouton qui produit des résultats ne garantit pas que la réponse est bonne – en fait, cela pourrait être très faux et seul un data scientist qualifié le saurait.

Ce n’est qu’une question de temps

Malgré ces mises en garde, la démocratisation de la science des données persiste ici, comme en témoigne son expansion logiciels et outils d’analyse. Thomas Redman et Thomas Davenport font partie de ceux qui prônent le développement de “Scientifiques citoyens des données” même la sélection des compétences et des capacités de base en science des données dans chaque poste embauché.

Cependant, la démocratisation de la science des données ne doit pas être poussée à l’extrême. L’analyse n’a pas besoin d’être à portée de main pour qu’une organisation prospère. Combien de personnes incroyablement talentueuses ne seraient pas embauchées simplement parce qu’elles manquent de “compétences de base en science des données” ? C’est irréaliste et trop restrictif.

Alors que les chefs d’entreprise cherchent à démocratiser les données et l’analyse dans leurs organisations, la vraie question qu’ils devraient se poser est de savoir “quand” cela a le plus de sens. Cela commence par reconnaître que tous les « citoyens » d’une organisation ne sont pas comparablement qualifiés pour être un expert en données citoyennes. Comme Nick Elprin, PDG et co-fondateur de Domino Data Labs, qui fournit des outils de science des données et d’apprentissage automatique aux organisations, m’a dit dans une récente interview : « Une fois que vous vous lancez dans la modélisation, il y a souvent des problèmes statistiques plus complexes qui se cachent. Surface.”

Le défi de la démocratisation des données

Considérez une chaîne d’épiceries qui a récemment utilisé des méthodes prédictives avancées pour planifier correctement la demande afin d’éviter d’avoir trop de stocks (entraînant des pertes) ou trop peu (entraînant des pertes de ventes). Les pertes dues à la détérioration et aux stocks n’étaient pas énormes, mais le problème du confinement était très difficile à résoudre – compte tenu de toutes les variables de la demande, de la saisonnalité et du comportement des consommateurs. La complexité du problème signifiait que la chaîne d’épicerie ne pouvait pas laisser le soin aux scientifiques citoyens de le résoudre, mais plutôt utiliser une équipe de scientifiques de données authentiques et bien formés.

La citoyenneté des données nécessite une «démocratie représentative», comme Elprin et moi en avons discuté. Tout comme les citoyens américains élisent des politiciens pour les représenter au Congrès (vraisemblablement pour agir dans leur meilleur intérêt sur les questions législatives), les organisations ont besoin d’une bonne représentation de scientifiques et d’analystes de données pour peser sur des questions que d’autres n’ont tout simplement pas l’expertise pour résoudre. à l’adresse.

Bref, il s’agit de savoir quand et jusqu’où démocratiser les données. Je propose les cinq critères suivants :

Considérez le niveau de compétence d’un “citoyen”: Le citoyen scientifique des données est là pour rester sous une forme ou une autre. Comme indiqué précédemment, il n’y a tout simplement pas assez de scientifiques des données pour tout le monde, et l’utilisation de ce talent rare pour résoudre tous les problèmes de données n’est pas durable. Plus précisément, la démocratisation des données est essentielle pour instiller un état d’esprit analytique dans toute l’organisation. Un exemple bien connu est Coca Colaqui a lancé une académie numérique pour former les gestionnaires et les chefs d’équipe, produisant des diplômés du programme qui sont responsables d’environ 20 initiatives numériques, d’automatisation et d’analyse sur plusieurs sites des opérations de fabrication de l’entreprise.

Cependant, lorsqu’il s’agit de s’engager dans la modélisation prédictive et l’analyse de données avancées qui pourraient changer fondamentalement le fonctionnement de la société, il est essentiel de prendre en compte le niveau de compétence du « citoyen ». Un outil sophistiqué entre les mains d’un data scientist est additif et précieux ; le même outil entre les mains de quelqu’un qui ne fait que “jouer avec les données” peut conduire à des erreurs, des hypothèses incorrectes, des résultats douteux et une mauvaise interprétation des résultats et des conclusions.

Mesurer l’importance du problème : Plus le problème est important pour l’entreprise, plus il est urgent d’avoir un expert en analyse de données. Par exemple, la génération d’un graphique simple des tendances d’achat historiques peut probablement être effectuée par une personne disposant d’un tableau de bord qui affiche les données de manière visuellement attrayante. Mais une décision stratégique qui a un impact significatif sur les opérations d’une entreprise nécessite une expertise et une précision fiable. Par exemple, le montant qu’une compagnie d’assurance devrait facturer pour une police est si fondamental pour le modèle d’entreprise lui-même qu’il serait imprudent de laisser cette tâche à un non-expert.

Déterminez la complexité du problème : La résolution de problèmes complexes dépasse les capacités du professionnel typique des données citoyennes. Considérez la différence entre la comparaison des scores de satisfaction des clients entre les segments de clientèle (mesures simples et bien définies et risque plus faible) et l’utilisation de l’apprentissage en profondeur pour détecter le cancer chez un patient (complexe et risque élevé). Une telle complexité ne peut être laissée à un non-expert pour prendre des décisions cavalières – et potentiellement de mauvaises décisions. Lorsque la complexité et les enjeux sont faibles, la démocratisation des données prend tout son sens.

Un exemple est une entreprise Fortune 500 avec laquelle je travaille qui utilise des données tout le temps. Il y a quelques années, j’ai dirigé un programme de formation dans lequel plus de 4 500 managers ont été divisés en petites équipes, chacune invitée à formuler un problème commercial important pouvant être résolu à l’aide d’analyses. Les équipes étaient habilitées à résoudre des problèmes simples à l’aide des outils logiciels disponibles, mais la plupart des problèmes survenaient précisément parce qu’ils étaient difficiles à résoudre. L’important est que ces gestionnaires aient été Non chargé de résoudre ces problèmes difficiles, mais plutôt de travailler avec l’équipe de science des données. Ces 1 000 équipes ont identifié pas moins de 1 000 opportunités commerciales et 1 000 façons dont l’analyse pourrait aider l’organisation.

Aidez les personnes connaissant le domaine : Si une entreprise recherche des informations « directionnelles » (le client X est plus susceptible d’acheter un produit que le client Y), la démocratisation des données et un niveau inférieur de science des données citoyennes suffiront probablement. Traiter ces types d’analyses de niveau inférieur peut en fait être un excellent moyen de donner aux personnes ayant une expertise en la matière (c’est-à-dire être aussi proche que possible des clients) avec des outils de données simplifiés. Une plus grande précision (par exemple, dans des problèmes à enjeux élevés et complexes) nécessite une expertise.

Le cas le plus convaincant d’exactitude est lorsque des décisions importantes doivent être prises en fonction d’un certain seuil. Si un plan de traitement agressif contre le cancer avec des effets secondaires importants devait être entrepris, par exemple avec un risque de cancer supérieur à 30 %, il serait important de faire la distinction entre 29,9 % et 30,1 %. La précision est importante, en particulier dans les domaines de la médecine, des opérations cliniques, des opérations d’ingénierie et pour les institutions financières qui déplacent les marchés et prennent des risques, souvent pour réaliser de très petites marges à grande échelle.

Invitez des experts à rechercher les biais : L’analyse avancée et l’intelligence artificielle peuvent facilement conduire à des décisions considérées comme « biaisées ». C’est difficile en partie parce que le but de l’analyse est de différencier, c’est-à-dire de baser les choix et les décisions sur certaines variables. (Envoyez cette offre à cet homme plus âgé, mais pas à cette femme plus jeune, car nous pensons qu’ils répondront avec un comportement d’achat différent.) La grande question est donc de savoir quand une telle discrimination est réellement acceptable et même bonne – et quand elle est sortie de caractère intrinsèquement problématique, injuste et dangereux pour la réputation de l’entreprise.

Prenons un exemple Goldman Sachs, accusée de discrimination en offrant moins de crédit sur sa carte de crédit Apple aux femmes qu’aux hommes. En réponse, Goldman Sachs a déclaré qu’il n’utilisait pas le sexe dans son modèle, mais uniquement des facteurs tels que les antécédents de crédit et les revenus. Cependant, on pourrait soutenir que les antécédents de crédit et les revenus sont corrélés au sexe, et l’utilisation de ces variables pénalise les femmes, qui ont tendance à gagner moins d’argent en moyenne et ont historiquement eu moins d’opportunités d’obtenir un crédit. Lors de l’utilisation d’un résultat discriminant, les décideurs et les professionnels des données doivent comprendre comment les données ont été générées et comment les données sont liées, ainsi que comment mesurer des éléments tels que le traitement différentiel et bien plus encore. Une entreprise ne devrait jamais risquer sa réputation en ne laissant qu’un citoyen expert en données déterminer si un modèle est biaisé.

La démocratisation des données a ses avantages, mais elle comporte aussi des défis. Donner les clés à chacun ne fait pas de lui un expert, et acquérir les mauvaises connaissances peut être désastreux. Les nouveaux outils logiciels peuvent permettre à n’importe qui d’utiliser les données, mais ne confondez pas cet accès généralisé avec une véritable expertise.

Leave a Reply

Your email address will not be published. Required fields are marked *