Data Science : Changeons de Mode !
Pour les entreprises françaises, utiliser efficacement la Data est un processus complexe : seulement 17% d’entre elles se sentent matures en matière d’analyse de données.
Vous l’avez sûrement vécu : une majorité de projets Data stagnent à l’état de “concept”, sans jamais donner lieu à des applications en production.
Par application, nous entendons un logiciel Data intelligent, activement intégré à un processus métier ou à un service, qui le transforme. Cela va au delà de la simple data visualization ou du dashboard — parfois (sévèrement) qualifiés de Minitels du Big Data !
#DataScience : Changeons de Mode ! #BigData Click To Tweet
La difficulté de passer en production peut provenir de plusieurs facteurs :
- les trouvailles des Data Scientists restent prisonnières de leurs ordinateurs, car non conçues pour être partagées de façon compatible avec le SI (Système d’Information) de l’entreprise, ou pas assez ergonomiques
- les utilisateurs finaux ne sont pas impliqués suffisamment tôt dans le projet — on se pose à la fin la question de l’adéquation de ce que l’on a fait avec le business
- l’organisation est inadaptée : rôles trop cloisonnés entre les « thinkers » et les « doers », source de frustrations
- etc.
La démarche traditionnelle
Kaggle, Internet, les MOOCs, … nous apprennent comment mener à bien un projet « Big Data » :
- définition du besoin
- collecte des données
- nettoyage
- analyse (data visualisation)
- modélisation
- restitution (dashboards)
- production
Cette démarche est en premier lieu centrée sur les aspects techniques, pour ensuite aboutir dans un second temps à l’application. Elle a été appropriée pour les 3 dernières années, alors que la barrière à l’entrée était essentiellement technologique.
Mais une rupture est en train de s’opérer : les outils de Data Science deviennent maintenant matures, de plus en plus faciles à utiliser, par un nombre croissant de collaborateurs. Amazon, Google, Microsoft ont lancé leur plateformes spécialisées, Spark 2 va sortir, le deep learning se banalise.
Prenons une analogie : pour une startup de la digital economy, la technologie n’est souvent pas ce qui fait la différence (mais plutôt une interface bien conçue, une expérience utilisateur exceptionnelle). Il en devient de même pour les projets Data : l’usage, l’humain et le design sont les facteurs clés de réussite — plus seulement les aspects techniques.
Vers une nouvelle approche
Vers une nouvelle approche des projets #DataScience #BigData Click To Tweet
C’est pourquoi il est temps de changer et d’inverser le cycle des projets de Data Science :
Non plus partir du Data Lake pour aboutir à l’application, mais partir de l’application puis remonter au Data Lake.
Dans de nombreux cas, tout le monde y trouve son compte :
- les métiers utilisateurs peuvent exprimer leurs besoins dès le début
- les services informatiques peuvent anticiper la mise en production, et préparer l’environnement adéquat
- les data scientists savent enfin quel problème précis il doivent cracker, et peuvent concentrer leur énergie dessus
- les software developers sont impliqués très tôt dans le développement de l’application, ce qui est propice aux incréments agiles et à un engagement plus marqué de leur part
Comment briser la culture du #PoC permanent dans les projets #DataScience ? Click To Tweet
Cette approche novatrice, qui brise la culture du POC permanent, est au cœur de l’offre Zelros. Dès le jour 1 du projet, un embryon de Data App est déployé : logiciel encore limité, mais fonctionnel, propice aux raffinements. Les Data Apps aident nos clients à incarner leurs projets, et à tendre les équipes vers un objectif commun atteignable en quelques semaines — et non plus plusieurs mois.
Essayez cette recette dans vos prochains projets et faites-nous part de vos retours. Chez vous, quels résultats avez-vous obtenus ?