Comment prédire l’avenir avec des données géo enrichies
22 mai 2019
Utiliser et valoriser les données géographiques enrichies pour améliorer la modélisation prédictive et la segmentation.
Aujourd’hui, les gestionnaires sont conscients des possibilités infinies que les données, au sens large, peuvent apporter à leur entreprise. Cependant, la variété et la quantité d’informations qu’ils possèdent sont si imposantes que de simplement tenter de trouver le point de départ représente une difficulté majeure.
En d’autres termes, ils sont confrontés à deux questions principales: que puis-je faire avec mes données et quelles réponses peuvent-elles me donner? En tant que spécialistes des données, nous devons évaluer à la fois les questions et les réponses en lien avec la donnée, ce qui représente uniquement la partie visible de l’iceberg.
Mixage Big Data
Analyse
Productivité
Les données de l’entreprise, la ligne de départ
Enfin, un autre élément à considérer est le choix des variables prédictives du modèle.
Au-delà du fait d’être significatif, l’évaluation de tous les paramètres du modèle dans le futur est une condition préalable à la modélisation.
Pour revenir à notre exemple d’entreprise de vente au détail, les conditions météorologiques, les catastrophes naturelles (pluie, orages, fortes chutes de neige, tornades) ainsi que les événements imprévisibles externes (travaux routiers, grèves, pannes) ont un impact significatif sur les ventes. Cependant, il n’est pas possible de calculer ces paramètres dans une perspective de prévision, car il est impossible de connaître a priori leurs occurrences dans le futur. Au total, la partie modèle ne représente encore qu’une faible proportion de l’ensemble du processus.
La valeur ajoutée de l’enrichissement des données géographiques
Par données géographiques, nous entendons des données ayant une composante géographique, comme des coordonnées X / Y, une géométrie (point, ligne, polygone) ou liées à une entité géographique (code postal, région, province). On parle ici de sources de données de recensement gouvernementales bien connues (StatsCan), de celles de fournisseurs de données géographiques produisant des données de trafic (HERE Traffic Analytics) ou encore de POI et autres types de données contextuelles (HERE, TomTom, Precisely (anciennement Pitney Bowes), Environics Analytics).
Vous désirez des jeux de données d’enrichissement supplémentaires? Les experts de Korem peuvent vous aider à sélectionner le meilleur jeu de données selon vos besoins.
Mettre un visage sur vos clients
Intégration globale des données et modélisation, la meilleure recette du mix pour le meilleur résultat
Construire les meilleurs modèles prédictifs nécessite la mise en place des meilleures pratiques, telles que les procédures par étapes intégrées en lien avec la méthodologie DM-CRISP qui considèrent l’ensemble des hypothèses ultérieures (sélection de variables, multicolinéarité, corrélation vs causalité).
Les défis liés à l’analyse prédictive dans un contexte géographique sont énormes, le prix à payer est assurément élevé, au sens propre comme au sens figuré.