Dataiku est une plateforme de data science, dont l’objectif est de rendre l’utilisation des données accessible à tous. Entretien avec Emilie Stojanowski, manager du programme Ikig.ai (Dataiku For Good).
Qu’est-ce que Dataiku ?
Dataiku est une startup créée en 2013 par quatre ingénieurs R&D français. Nous proposons une plateforme d’Analytique et de Data Science. Le but est de faire en sorte que les personnes expertes et non expertes en data puissent tirer profit de leurs données. Notre interface est « user friendly » et permet aux non experts d’avoir accès à une partie algorithmique qui ne nécessite aucune connaissance en codage, même s’il est tout à fait possible pour des personnes expertes métier de coder au sein de la plateforme. La plateforme est installée directement sur les infrastructures des clients et leurs données restent leur propriété. Elle propose une large palette de paramètres et des algorithmes prédéfinis, afin de s’adapter à toutes sortes de clients.
En quoi consiste votre programme Dataiku For Good ?
Mis en place en 2019, ce programme permet entre autres aux ONG de bénéficier gracieusement de notre plateforme ainsi que des formations autour de celle-ci. En fonction de leur niveau en data, nous leur proposons l’accompagnement de data scientist. Nous travaillons par exemple avec l’ONG The Ocean Clean Up, qui travaille sur le nettoyage des déchets plastiques, notamment grâce à des barrières dans les océans et des vaisseaux dans les rivières qui captent les plastiques. L’ONG capte des milliards de données récoltées par des chalutiers qui signalent les plastiques croisés en mer. Avec la plateforme, nous les aidons à tirer profit de ces données pour comprendre les déplacements des barrières, prévoir le ramassage des plastiques captés par les bateaux, à partir du croisement des données collectées par les capteurs présents sur les barrières, et de données météorologiques. Un autre projet consiste également à analyser les mouvements des déchets et les reflux côtiers via l’analyse de données provenant des publications sur les médias sociaux et le croisement de publications scientifiques.
Nous avons également un projet interne d’analyse de notre empreinte carbone, grâce à notre plateforme. Ceci en analysant nos déplacements à l’étranger grâce aux données issues de nos différents outils tels que notre plateforme de voyage ou à partir des notes de frais, mais aussi l’empreinte de la partie IT de l’entreprise notamment. Le calcul de l’empreinte en elle-même est basée sur le croisement de ces données et les indications fournies entre autre par l’Ademe.
Votre plateforme peut-elle s’adresser à des collectivités territoriales souhaitant réaliser des économies d’énergie par exemple ?
A partir du moment où nous avons des données à exploiter, notre solution est applicable. Pour les collectivités il y a des sujets autour de la mobilité, des réflexions autour des smart cities... Certaines collectivités souhaitent réduire les impacts écologiques au niveau de leur territoire, ou ont besoin d’analyser des données dans le cadre de projets sur la reforestation par exemple.
Nous constatons que souvent, il existe un manque d’accès aux données, ou bien qu’on ne sait pas comment les exploiter. Dataiku intervient pour voir si les données sont exploitables, et sinon, pour conseiller les clients sur quel type de données collecter et de quelle manière, afin qu’elles soient exploitables. Notre plateforme permet de faire le tri facilement entre ce qui est exploitable ou non et comment en tirer profit pour répondre à une demande spécifique.
Emilie Stojanowski, manager du programme Ikig.ai chez Dataiku For Good