La distribution de Poisson est une distribution de probabilité discrète qui modélise la fréquence de certains événements pendant un intervalle de temps fixe en fonction de la fréquence moyenne d'occurrence de ces événements.
En d'autres termes, la distribution de Poisson est une distribution de probabilité discrète qui, seulement en connaissant les événements et leur fréquence moyenne d'occurrence, peut-on connaître leur probabilité.
Expression de la distribution de Poisson
Étant donné une variable aléatoire discrète X, nous disons que sa fréquence peut être approchée de manière satisfaisante à une distribution de Poisson, telle que :
Contrairement à la distribution normale, la distribution de Poisson ne dépend que d'un seul paramètre, mu (marqué en jaune).
Mu rapporte le nombre attendu d'événements qui se produiront dans un intervalle de temps défini. Quand on parle de quelque chose « attendu », nous devons le réorienter pour penser à la moyenne. Par conséquent, mu est la moyenne de la fréquence des événements.
La moyenne et la variance de cette distribution sont très strictement positives.
Représentation
Étant donné une distribution de Poisson de moyenne 2, la distribution de probabilité de densité est la suivante :
La fonction n'est définie que sur des valeurs entières de x.
Toutes les distributions de probabilité de densité de Poisson ne se ressembleront pas même si nous gardons l'échantillon le même. Si nous modifions la moyenne, c'est-à-dire le paramètre dont dépend la fonction, la fonction changera également.
Fonction de densité de probabilité (pdf)
Cette fonction est comprise comme la probabilité que la variable aléatoire X prenne une valeur spécifique x. C'est l'exponentielle de la moyenne négative multipliée par la moyenne élevée à l'observation et le tout divisé par la factorielle de l'observation.
Comme indiqué, pour connaître la probabilité de chaque observation, nous devrons substituer toutes les observations dans la fonction. Autrement dit, x est un vecteur de dimension n qui contient toutes les observations de la variable aléatoire X. La moyenne serait aussi un vecteur mais d'une dimension, tel que :
Une fois que nous avons les probabilités calculées, avec les observations, nous pouvons tracer la distribution de densité de probabilité.
Histoire
Le nom de cette distribution vient de son créateur, Siméon-Denis Poisson (1781-1840), mathématicien et philosophe français, qui voulait modéliser la fréquence des événements au cours d'un intervalle de temps fixe. Il a également participé au perfectionnement de la loi des grands nombres.
Application
La distribution de Poisson est utilisée dans le domaine du risque opérationnel afin de modéliser des situations dans lesquelles une perte opérationnelle survient. En risque de marché, le processus de Poisson est utilisé pour les temps d'attente entre les transactions financières dans les bases de données à haute fréquence. Aussi, le risque de crédit est pris en compte pour modéliser le nombre de faillites.
Exemple
Nous partons du principe que nous sommes en hiver et que nous voulons skier avant décembre. La probabilité que les stations de ski ouvrent avant décembre est de 5%. Sur les 100 stations de ski, nous voulons connaître la probabilité que la station de ski la plus proche ouvre avant décembre. La valorisation de cette station de ski est de 6 points.
Les entrées nécessaires pour calculer la fonction de probabilité de densité de Poisson sont l'ensemble de données et mu :
- Ensemble de données = 100 stations de ski.
- Mu = 5% * 100 = 5 est le nombre attendu de stations de ski compte tenu de l'ensemble de données.
Ainsi, la gare la plus proche a 14,62 % de chances d'ouvrir avant décembre.
Probabilité de fréquence