ROADEF 2023 : 24ème congrès de la Société Française de Recherche Opérationnelle et d'Aide à la Décision

sciencesconf.org:roadef2023:434609

Optimalité des politiques de rabais récurrents pour un modèle bi-niveau avec inertie des clients

Quentin Jacquet 1, 2, 3, @ , Wim Van Ackooij 1, @ , Clémence Alasseur 1, @ , Stéphane Gaubert 4, 5, @

1 : EDF R&D

EDF

2 : Inria Saclay - Ile de France

Institut National de Recherche en Informatique et en Automatique

3 : Centre de Mathématiques Appliquées - Ecole Polytechnique

Ecole Polytechnique, Centre National de la Recherche Scientifique : UMR7641

4 : Centre de Mathématiques Appliquées - Ecole Polytechnique (CMAP)

Polytechnique - X

CMAP École Polytechnique, Route de Saclay 91128 Palaiseau Cedex - France

5 : Tropical team

INRIA

On considère un modèle de tarification dynamique, dans lequel une population de clients (followers) peut changer à tout moment de contrat en fonction des conditions tarifaires et de caractéristiques propres à chaque client, comme l'inertie (propension à rester chez le même fournisseur). Un fournisseur (leader) cherche alors à maximiser son revenu moyen par unité de temps, en supposant que la population est de taille infinie. Cela revient à étudier une limite ``champ moyen'' d'une famille de processus de décision Markoviens, ce qui nous ramène ici à un processus de décision déterministe mais dont l'espace d'état est un produit de simplexes.

Nous supposons que, le signal de prix étant fixé, la population évolue selon une dynamique linéaire positive, issue de la maximisation d'une fonction d'utilité (cela inclue notamment les réponses de type logit). En ce sens, le processus est vu comme un problème bi-niveau itéré dans le temps.

Nous montrons l'existence d'une politique optimale en reformulant le problème par une équation ergodique. Pour cela, nous utilisons une hypothèse de primitivité de l'ensemble des dynamiques afin d'exploiter des propriétés de contraction pour la métrique de Hilbert.

Nous présentons enfin une application issue de la tarification de l'énergie, en résolvant le problème par un algorithme d'itération sur les politiques après une discrétisation semi-Lagrangienne de l'espace d'état.

Pour une inertie faible, la politique optimale obtenue correspond à une stratégie turnpike, où le fournisseur cherche à atteindre rapidement une stratégie à prix constant. En revanche, lorsque l'inertie de certains clients est suffisante, la stratégie optimale donne lieu à des politiques de tarification cycliques, s'interprétant comme des rabais périodiques.

Type :	:	Article
Thématiques	:	Optimisation bi-niveaux et applications
Mots-Clés	:	Biniveau dynamique ; contrôle ergodique ; tarification ; limite champ moyen de processus de décision Markoviens

Vie privée | Accessibilité