Quelles données sont nécessaires aux logiciels de forecasting ?
Les données collectées par les entreprises peuvent être exploitées dans le cadre de différentes applications en intelligence artificielle telles que les prévisions de ventes, l’amélioration de l’expérience client, la réduction des coûts de stockage dans le retail, l’optimisation des ventes permanentes ou promotionnelles, la prévision du trafic client au sein des points de vente physiques, web et mobiles, etc. L’une des méthodes permettant l’exploitation de la data afin d’améliorer l’atteinte des objectifs S&OP des entreprises et des industriels est appelée le forecasting. Celle-ci permet la mise en place de modèles prédictifs et prévisionnels quantifiant l’évolution en fonction du temps de critères ou de variables business comme les flux de marchandises et humains, le pricing et les assortiments de produits.
Pour mener à bien la modélisation de ces prévisions, les entreprises doivent exploiter leurs données et les conjuguer à des données extérieures. Quelles sont ces données nécessaires et utiles à la réussite de l’apprentissage d’un modèle de forecasting ? Quelle data doivent fournir les retailers, les e-commerçants, les acteurs de la grande distribution ou les industriels afin de rendre possible une analyse poussée et une prévision des ventes optimale ? Nous faisons ici le point sur les données utiles à la construction de modèles de machine learning capables d’assurer le suivi de votre marché ou de prédire vos besoins business et marketing.
La prévision de ventes en industrie, en e-commerce et retail
La prévision des ventes est une des applications du forecasting en data science. Afin de mettre en place un modèle de forecasting, les spécialistes du machine learning ont recours à des données issues du passé et du présent afin de prédire l’évolution de certaines variables dans le futur. L’analyse des tendances passées fait partie des mécanismes permettant d’estimer et d’anticiper ces évolutions. D’autres techniques issues de l’intelligence artificielle sont également nécessaires au traitement des données en amont de la mise en place du forecast (fouille de données, classifications, etc.).
Les modèles de machine learning et de data mining (clustering, classification supervisée, etc.) permettent d’extraire des schémas récurrents (patterns) cachés à l’intérieur des données stockées par votre entreprise afin de les exploiter dans la mise en place de modèles prédictifs. En partant d’un cas d’usage, défini avec l’entreprise cliente, un acteur comme Verteego peut définir les données nécessaires afin de répondre au besoin du client. La data utile et essentielle à la modélisation d’un forecasting lié à la prévision des stocks ou aux stratégies de pricing regroupe l’ensemble des informations décrivant les phénomènes et les évènements pouvant avoir un impact sur ces processus.
Ainsi, la construction de modèles prédictifs passe par l’analyse de données historiques propres à l’entreprise ainsi que le croisement de celles-ci avec des variables ou data externes à votre structure, telles que les données météorologiques ou économiques du pays concerné. Le but derrière le choix des données est de s’assurer de prendre en compte tous les évènements pouvant interférer, infléchir ou modifier le cours des ventes et les flux des clients au sein des points de vente.
Les données historiques d’entreprise nécessaires au forecasting
Qu’il s’agisse d’accompagner des acteurs de la grande distribution, du retail ou des industriels dans l’optimisation de leurs processus S&OP, Verteego conseille les entreprises dans le choix des données à exploiter afin d’assurer la réussite de leur projet.
Les données internes définissent le premier type de data nécessaire à la mise en place de stratégies de pricing pour les soldes, les promotions, les ventes hors promotions et les soldes optimisées. Cette première catégorie regroupe les données historiques et internes à l’entreprise. Cette data réunit un ensemble d’informations collectées par le passé au sujet des activités de l’entreprise. Celle-ci peut regrouper les :
- données liées aux produits ou services proposés par votre entreprise (nom, catégories, marque, packaging, etc.) ;
- renseignements concernant les différents canaux et modalités de vente que vous investissez (points de vente, livraison, drive, click and collect, application web, application mobile, etc.) ;
- caractéristiques des points de vente (PDV) à savoir leur localisation géographique, leur taille, les évènements locaux ayant lieu à proximité de ces points de vente, les assortiments, etc. ;
- informations au sujet de la force de ventes des points de vente (rémunération, qualification, affluence et visites en fonction des horaires du PDV) ;
- historiques de promotions et des mécanismes promotionnels mis en place par le passé (budgets de pub investis, types de pubs, canaux SEA, réseaux sociaux, mode de merchandising, affichages au sein de catalogues, etc.).
Le but derrière le recueil de ces tables de données est d’apporter une vision globale et précise au sujet des produits proposés par votre entreprise afin d’assurer une modélisation de qualité par la suite. Cependant, recueillir les données internes de votre organisation ne suffit pas. En effet, les processus et le fonctionnement d’un business ne sont pas étanches aux évènements extérieurs (météo, saison, politique, économie, fêtes, vacances, grèves, etc.). Ainsi, l’évolution de la vente d’un produit donné peut être expliquée ou corrélée à des évènements extérieurs.
La data externe pour enrichir les données internes
Il existe donc un second type de données nécessaires à la création de modèles de forecasting. Il s’agit d’informations externes à votre entreprise. Elles vont renseigner sur des éléments ou des conditions exogènes au fonctionnement de votre structure, mais pouvant avoir un impact sur elle. Cette data concerne les :
- conditions météorologiques ;
- contextes économiques de la zone géographique ciblée ;
- informations liées à la concurrence ;
- facteurs concernant les évènements spéciaux tels que les épidémies (COVID-19) par exemple.
Le recoupement des données internes et exogènes permet de nourrir la précision du forecasting et d’apporter une information plus complète au sujet des facteurs pouvant avoir des répercussions sur vos processus de ventes ou autres éléments à optimiser.
Forecasting et niveaux d’importance des données
Les données utilisées lors de la création de modèles de machine learning et d’outils d’intelligence artificielle n’ont pas toutes la même importance. Le niveau d’utilité ou d’importance dépend du cas d’usage ou l’objectif fixé en amont du projet d’analyse de la data. Les données recueillies peuvent être classées par ordre d’importance : essentielles, souhaitables, complémentaires ou exogènes utiles.
Dans le cadre de l’optimisations des ventes, par exemple, la priorité sera donnée aux détails liés aux produits vendus. Dans ce cas, les tickets de caisse ou les factures apportent l’information chronologique (date, horaires) essentielle au forecasting ainsi que les précisions nécessaires sur les produits achetés (prix, canal de vente, promotion ou pas, gamme, marque, etc.). Les données chronologiques et de caractérisation des produits peuvent ensuite être complétées par des documents relatifs au référentiel marketing (planning des promotions, durées des offres, activités et animations programmées, etc.) de votre entreprise.
Enfin, la data complémentaire au sujet des fournisseurs, de la chaîne logistique et de la concurrence servira à enrichir la vue globale des schémas de vente de vos différents points de vente qu’ils soient physiques ou électroniques. Par ailleurs, il est à noter que les contraintes liées au supply chain management (délais, capacité logistique et de production) et au stockage peuvent également être étudiées dans le cadre de leur optimisation.
L’utilisation des données internes et externes chez Verteego
Après le recueil des différentes données nécessaires à la modélisation, Verteego procède à la préparation et l’exploitation de celles-ci. Par exemple, dans le cas de la grande distribution et du retail, les informations ainsi recueillies sont introduites au sein de l’outil Verteego Brain afin de générer le « Sales Genome » ou l’ADN d’un point de vente. En d’autres termes, Verteego Brain permet de mettre en place une carte d’identité propre à un point de vente. Celle-ci établit des caractéristiques telles que le nombre de clients du point de vente en question, ce qui y est vendu, les modalités de vente (drive, click and collect ou autre), les horaires d’affluence, etc.
D’autres informations plus détaillées concernant l’achat des produits vont émerger lors de l’établissement du Sales Genome :
- les produits achetés ;
- les effets de cannibalisation entre produits (cette donnée informe sur les produits qui sont privilégiés et achetés par les clients à la place d’un autre produit) ;
- les causes d’achat poussant la clientèle à consommer tel ou tel produit. Cette information est extraite notamment grâce à l’analyse des tickets de caisse. L’analyse d’un panier de client, représenté par un ticket, permet de dresser des liens entre les produits. Les cooccurrences d’articles au sein des tickets de caisse peuvent renseigner sur les liens existant entre eux et guider les entreprises dans le choix des assortiments de produits dans le futur par exemple ;
- la saisonnalité des produits ou les plages temporelles et les fréquences avec lesquelles ils sont achetés par les clients du point de vente analysé.
Les techniques d’intelligence artificielle développées par Verteego permettent de mettre en exergue des patterns apportant des informations structurées et exploitables par les industriels et les commerçants afin d’optimiser leurs processus de vente, de stockage et de merchandising entre autres. La modélisation des variables à optimiser en fonction de la dimension temporelle nécessite l’exploitation des données historiques et chronologiques des entreprises souhaitant optimiser leurs processus business et marketing. La réussite de ces projets repose également sur la prise en compte des paramètres exogènes aux entreprises et ayant un impact sur leurs fonctionnements. La récolte de ces données externes apporte des précisions supplémentaires servant à consolider le modèle et les prévisions qu’il génère.