Stratégies de pricing : optimisations utilisant les modèles prédictifs
Optimiser le pricing participe à l’atteinte des objectifs business des entreprises. Différents paramètres sont pris en compte lors de la définition des prix des produits à vendre : compréhension des comportements des clients, frais logistiques, saisonnalité, comportements des concurrents, etc. Aussi, l’analyse de toutes ces dimensions nécessite le recours à des outils d’aide à la compréhension des différentes dynamiques pouvant infléchir sur les prix des références commercialisées.
Le machine learning permet d’accompagner les entreprises dans la mise en place de leur politique de pricing en exploitant différents types de données et en maximisant le potentiel de la data historique des entreprises. Quels résultats l’intelligence artificielle permet-elle d’atteindre ? Quelles données doivent être fournies pour engendrer des prédictions de haute qualité ? Quels avantages apporte le recours aux modèles prédictifs ? Nous faisons le point sur les solutions qu’apporte la data science pour optimiser le pricing des produits proposés par les retailers, les e-commerçants et les acteurs de la grande distribution.
Stratégie de Pricing et objectifs business
Les projets basés sur le machine learning nécessitent la définition d’un objectif business guidant les actions à mener pour y répondre. Le use case commercial permet de définir un ensemble de variables à analyser et à optimiser. Ces variables cibles vont donc guider l’apprentissage des algorithmes de machine learning. Les objectifs commerciaux varient entre le besoin d’optimiser les marges de l’entreprise, augmenter le chiffre d’affaires, optimiser les assortiments de produits, améliorer les prévisions des promotions ou des ventes, etc. Le rôle de Verteego après définition de use case business est de proposer les scénarios à mettre en œuvre afin de garantir la réussite du projet.
Le projet démarre avec le lancement d’un POC (proof of concept) ciblant un périmètre précis de points de vente afin de tester les résultats avant la phase d’industrialisation. La validation de cette première phase passe par l’analyse des performances induites suite à l’optimisation des variables cibles grâce aux modélisations prédictives obtenues. Ces variables peuvent être : les coûts logistiques, la durée des promotions, le types de promotions, les assortiments de produits, etc.
Les spécificités à prendre en compte pour définir les prix
Dans le cas de l’optimisation du pricing, les entreprises doivent, pour améliorer la définition des prix de leurs produits, prendre en compte les spécificités des points de vente et des articles simultanément. En effet, les prédictions générées au niveau humain ne peuvent englober les corrélations entre produits et spécificités du point de vente (force de vente, géolocalisation, etc.). De plus, lorsque les données deviennent volumineuses des analyses de tendances et de corrélation deviennent difficiles à mettre en exergue. De ce fait, différents croisements de données doivent être envisagés afin de comprendre les facteurs nécessitant de faire évoluer les prix d’un produit, les promotions à lui octroyer, la durée des ventes promotionnelles à lui dédier et les canaux de communication à investir pour mieux le vendre.
Les données nécessaires aux technologies de machine learning
Les algorithmes de machine learning passent par une phase d’apprentissage où ils prennent en entrée différentes variables et fichiers de données. Dans le cadre de la mise en place de choix tarifaires, et pour garantir un apprentissage automatique réussi, différentes sources de données doivent être exploitées allant au-delà de la data historique de l’entreprise concernée.
Les données descriptives du produit
Le but étant d’optimiser le choix des tarifs à appliquer à un produit donné, la data renseignant sur les caractéristiques des articles ou produits à vendre fait partie des données essentielles. Le numéro de référence (SKU ou UGS), le mode de packaging, la marque, les alternatives à ce produit, sa catégorie, la saisonnalité de la vente du produit, le type de merchandising, etc. permettent de caractériser le produit et le décrire. Ces données seront croisées avec d’autres sources informationnelles qui pourront enrichir la connaissance à son sujet.
L’historique des ventes de l’entreprise
L’historique des ventes comprend à la fois les transactions effectuées en caisses, les promotions auxquelles a eu recours l’entreprise et les commandes passées pour ce produit. Les transactions liées au produit analysé sont indiquées dans les tickets de caisse des clients. Chaque ticket correspond à un panier client et renseigne de ce fait sur les assortiments récurrents de produits achetés conjointement. Le rôle des modèles prédictifs est de mettre ce genre de patterns en avant.
Les promotions liées aux produits peuvent être exprimées via de la data telle que les taux de réduction appliqués par le passé, le mix promotionnel choisi, le budget publicitaire investi. Enfin, des informations sur les canaux de vente utilisés viendront enrichir le tableau dressé au sujet de l’article étudié : drive, click and collect, commande en ligne, livraison, vente en magasin physique, vente en libre-service, etc.
La data liée à la chaîne logistique
Les informations récupérées de l’ensemble des acteurs de la supply chain : tarifs des matières premières, délais de livraison des fournisseurs, retards des fournisseurs par le passé, coûts de transport et de stockage, etc. Ce type de données renseigne sur la disponibilité du produit dans le temps, les facteurs qui peuvent affecter la rupture de ses stocks par exemple, sa vitesse d’écoulement, etc.
Les caractéristiques du point de vente
Les points de vente, qu’ils soient physiques ou virtuels, ont, selon leurs caractéristiques, un impact sur la vente du produit. Aussi, il est important de prélever des informations au sujet des unités de vente afin de comprendre plus en profondeur les paramètres pouvant servir de levier ou de frein à la vente d’une référence donnée.
Les données que les entreprises peuvent fournir afin d’enrichir l’apprentissage des modèles prédictifs sont : la localisation du point de vente, son type (web, mobile, magasin, etc.), les équipes de vente, leur rémunération, leurs horaires de travail, le taux d’affluence des clients, les comportements des clients en magasin, etc. Verteego exploite les données liées au point de vente et en tire des corrélations. Celles-ci seront par la suite regroupées au sein de la carte d’identité du magasin (le Sales Genome).
Les données exogènes nécessaires
Des données issues de sources exogènes à l’entreprise et à sa chaîne logistique sont combinées à la data décrite ci-dessus. Celles-ci peuvent renseigner sur le climat et la météo des régions habitées par la clientèle de l’enseigne ou du point de vente, les grèves, les fêtes, les festivals, le salaire moyen des clients entre autres. Des données décrivant le marché cible et la concurrence sont souhaitées également.
L’importance des données en machine learning
Le choix des données permet d’optimiser la qualité des prédictions générées par les algorithmes prédictifs. Aussi, leur qualité peut avoir un impact sur le retour sur investissement du projet. La data extraite des data lake de l’entreprise nécessitera un traitement en amont afin de combler les informations incomplètes, éliminer les doublons, segmenter et structurer les données recueillies.
Le choix des données est déterminant pour améliorer le retour sur investissement du projet. Celui-ci peut concerner à la fois l’augmentation des marges et du chiffre d’affaires, mais également des gains indirects tels que l’évitement des situations de surstocks et l’immobilisation inutile de capitaux sous forme de marchandises en réserves. Enfin, l’automatisation des tâches d’analyse et de prédiction permet de libérer les équipes opérationnelles et de marketing des tâches chronophages et leur permet de se focaliser sur des aspects à forte valeur ajoutée de leurs métiers.
Analyse des prédictions générées par Verteego
Lorsque l’apprentissage a été effectué, les résultats sont déployés au sein d’outils de data visualisation. Ces tableaux de bord résument les informations nécessaires à la compréhension des scénarios prédits par les modèles de machine learning. Chaque scénario peut être analysé en détail, l’utilisateur peut appréhender des variables comme :
- proportions de produits vendus selon leurs couleurs, taille ;
- quantités de produits vendus par jour, semaine ou mois ;
- chiffre d’affaires généré en fonction du temps et du produit ;
- résultats par type de démarque ou de promotion.
Pour un même produit, différents scénarios promotionnels sont prédits et permettent aux utilisateurs de choisir celui qui répond au mieux aux objectifs business de l’entreprise. Verteego met d’ailleurs en avant le degré d’importance et d’impact que peut avoir une variable sur un produit donné telle que la taille du magasin, le type de merchandising, le prix, etc. Cette caractéristique importante sert donc à quantifier la sensibilité de l’article à la variable en question. Cette option apporte une information supplémentaire au sujet du produit et permet de classer par exemple les produits selon l’efficacité qu’ont les promotions sur eux.
Pour conclure, l’optimisation du pricing à l’aide de l’intelligence artificielle permet d’atteindre un niveau de personnalisation par produit et par point de vente. Les grandes quantités de données que peuvent assimiler les algorithmes de l’apprentissage automatique autorisent la compréhension de corrélations et de tendances qui ne peuvent avoir lieu avec les outils classiques et manuels. Les scénarios proposés par les outils Verteego en aval du projet permettent de comprendre avec précision à quelles variables un produit au sein d’un point de vente spécifié est sensible.