Les data scientists ne sont PAS la solution

Les data scientists ne sont PAS la solution

Dans le secteur des medias une complainte se fait entendre de plus en plus souvent à propos des data scientists. Ils n’auraient aucune affinité pour les aspects métier. Le manque d’empathie des spécialistes business pour le monde de la data science ne fait que creuser le fossé que beaucoup d’entreprises déplorent entre ces deux catégories de personnel.

Corrélation ne signifie pas causalité

Le manque de compréhension « métier » devient particulièrement visible lors de la réalisation de modèles prédictifs. Trop souvent les data scientists recherchent des corrélations sans vérifier que ces dernières fassent sens (à ce stade, vous jugerez peut-être intéressant de jeter un œil à ce site qui répertorie les corrélations vides de sens).

Mais au fond, pourquoi les data scientists devraient-ils perdre du temps à vérifier que les modèles tiennent la route d’un point de vue métier ? Un collègue suggérait que justement le propre des data scientists est précisément de rechercher des corrélations auxquelles l’entreprise n’aurait jamais pu penser sans l’aide du Big Data. D’un point de vue purement technique, cette thèse est défendable. Si les corrélations n’ont pas de sens « métier », la réutilisation du modèle sur des données récentes invalidera le modèle.

Le Big Data n’explique pas le lien de causalité

Il y a 20 ans, en l’absence de puissance de calcul suivante, les économètres échafaudaient des hypothèses qu’ils tentaient de vérifier grâce aux données. Ces hypothèses étaient basées sur une compréhension a priori du comportement de l’Humain.

Aujourd’hui, la puissance de calcul étant disponible pour un coût dérisoire, les data scientists ne s’embarrassent plus de modèles préalables. Ils calculent toutes les corrélations possibles, quitte à produire un modèle unique pour chaque individu.

L’approche grégaire a laissé la place à une approche individualiste.

Le Big Data produit des modèles purement mathématiques desquels les aspects sociologiques ont été éliminés. Dns l’entreprise cette connaissance sociologique du comportement des clients était l’apanage des spécialistes métier, qui perdent du terrain. Si cela peut ressembler à un progrès pour certains (on passe d’une connaissance métier perçue comme subjective à une objectivation rassurante des connaissances) les conséquences me semblent importantes.

Que se passe-t-il quand la sociologie est abandonnée au profit du Big Data ?

Mettre toutes ses billes dans le quantitatif (le Big Data en l’occurrence) est un signe annonciateur de problèmes stratégiques à moyen-terme. C’est le débat éternel en marketing qualitatif et marketing quantitatif qui recommence.

En poussant les data scientists à produire des modèles par dizaines, en multipliant les segments pour lancer des campagnes toujours plus précises, nous perdons lentement mais sûrement la connaissance essentielle du « pourquoi ». Pourquoi un individu fait-il ce que nous observons ? Or cette connaissance est essentielle pour se projeter dans le futur, anticiper les tendances, pour innover et répondre aux demandes émergentes (et non encore documentées dans les données) des clients.

Conclusion

Comme je le dit souvent le Big Data n’est qu’un outil parmi d’autres. Il a toutefois été présenté comme une panacée, un moyen de rationaliser et d’être plus efficace. Si cela est sans doute vrai dans la gestion quotidienne de l’entreprise, le Big Data ne peut en aucun cas remplacer la formulation d’une stratégie d’entreprise. Le Big Data ne vous dira pas non plus quels produits vos clients voudront acheter dans 2 ans. Tout simplement par que ces produits n’existant pas, ils ne génèrent aucune donnée. N’oubliez pas que le Big Data se base sur le passé. Or la formulation de l’avenir, la capacité à innover est et doit rester une compétence entre les mains des humains.

Photo : shutterstock

Posted in Data et IT, Marketing.