Une approche d'apprentissage automatique pour la tarification dynamique sous contrainte de stock

Crédit :iStock

En 1933, William R. Thompson a publié un article sur un algorithme basé sur un modèle bayésien qui deviendrait finalement connu sous le nom d'échantillonnage de Thompson. Cette heuristique a été largement ignorée par la communauté académique jusqu'à récemment, quand il est devenu l'objet d'une étude intense, grâce en partie aux sociétés Internet qui l'ont mis en œuvre avec succès pour l'affichage d'annonces en ligne.

L'échantillonnage de Thompson choisit des actions pour traiter l'exploration-exploitation dans le problème des bandits à plusieurs bras afin de maximiser les performances et d'apprendre en permanence, l'acquisition de nouvelles informations pour améliorer les performances futures.

Dans une nouvelle étude, "Gestion des revenus du réseau en ligne à l'aide de Thompson Sampling, " Le professeur du MIT David Simchi-Levi et son équipe ont maintenant démontré que l'échantillonnage de Thompson peut être utilisé pour un problème de gestion des revenus, où la fonction de demande est inconnue.

Intégration des contraintes d'inventaire

Un défi majeur à l'adoption de l'échantillonnage Thompson pour la gestion des revenus est que la méthode originale n'intègre pas les contraintes d'inventaire. Cependant, les auteurs montrent que l'échantillonnage de Thompson peut être naturellement combiné avec une formulation de programme linéaire classique pour inclure des contraintes d'inventaire.

Le résultat est un algorithme de tarification dynamique qui intègre la connaissance du domaine et présente de solides garanties de performances théoriques ainsi que des résultats de performances numériques prometteurs.

De façon intéressante, les auteurs démontrent que l'échantillonnage de Thompson obtient de mauvaises performances lorsqu'il ne prend pas en compte la connaissance du domaine.

Simchi-Lévi dit, « Il est passionnant de démontrer que l'échantillonnage de Thomson peut être adapté pour combiner une formulation de programme linéaire classique, inclure les contraintes d'inventaire, et de voir que cette méthode peut être appliquée aux problèmes généraux de gestion des revenus. »

L'application de l'industrie améliore les revenus

L'algorithme de tarification dynamique proposé est très flexible et est applicable dans une gamme d'industries, des compagnies aériennes et de la publicité sur Internet à la vente au détail en ligne.

La nouvelle étude, qui vient d'être accepté par la revue Operations Research, fait partie d'un projet de recherche plus vaste de Simchi-Levi qui combine l'apprentissage automatique et l'optimisation stochastique pour améliorer les revenus, marges, et part de marché.

Les algorithmes développés dans ce flux de recherche ont été mis en œuvre dans des entreprises telles que Groupon, un teneur de marché quotidien, Rue La La, un détaillant américain de vente flash en ligne, B2W numérique, un grand détaillant en ligne en Amérique latine, et dans une grande entreprise brassicole, où Simchi-Levi et son équipe ont optimisé la promotion et les prix de l'entreprise dans divers canaux de vente au détail.

Intelligence artificielle :l'objectif du test ARC va au-delà des questions factuelles

Drake bat un nouveau record de streaming dans les jeux vidéo

Électronique