Les régressions simples et/ou multiples incorporent fréquemment des logarithmes dans l'équation afin d'assurer la stabilité des régresseurs, de réduire les valeurs aberrantes et d'établir différentes vues de l'estimation, entre autres applications.
La principale utilité des logarithmes pour l'analyse économétrique est leur capacité à éliminer l'effet des unités des variables sur les coefficients. Une variation dans les unités n'impliquerait pas de changement dans les coefficients de pente de la régression. Par exemple, si l'on traite les prix comme une variable dépendante (Y) et la pollution sonore comme une variable indépendante (X).
Pour y voir plus clair, imaginons que nous ayons une variable en euros et une autre en kilos. Si nous passons les deux variables aux logarithmes, nous les aurons mesurées dans les mêmes « unités » et donc notre modèle aura plus de stabilité.
On peut trouver des logarithmes naturels, (ln), où la base est eX, et les logarithmes d'autres bases, (log). En finance, le logarithme népérien est davantage utilisé en raison de la considération de eX capitaliser sur les rendements continus d'un investissement. En économétrie, il est également courant d'utiliser le logarithme népérien.
Analyse de régressionConsidérations relatives au logarithme dans l'analyse économétrique
Un autre avantage de l'application de logarithmes sur Y est sa capacité à réduire la plage de la variable d'une quantité inférieure à celle de l'original. Cet effet réduit la sensibilité des estimations aux observations extrêmes ou atypiques, tant pour les variables indépendantes que dépendantes. Les valeurs aberrantes sont des données qui, en raison d'erreurs ou du fait qu'elles sont générées par un modèle différent, sont très différentes de la plupart des autres données. Un exemple extrême serait un échantillon où la majorité des observations se situent autour de 0,5 et il y a quelques observations avec des valeurs de 2,5 ou 4.
La principale caractéristique que l'on recherche des variables pour pouvoir appliquer des logarithmes est qu'il s'agit de quantités strictement positives. Les exemples les plus typiques sont les salaires, le nombre de ventes d'une entreprise, la valeur marchande des entreprises, etc. Nous incluons également les variables que nous pouvons mesurer en années, par exemple l'âge, l'expérience professionnelle, les années d'enseignement, l'ancienneté dans une entreprise, etc.
Normalement, dans les échantillons contenant de grands nombres entiers d'éléments, des logarithmes ont déjà été appliqués et sont présentés transformés pour faciliter leur interprétation. Quelques exemples de variables où nous pouvons appliquer des logarithmes seraient le nombre d'étudiants inscrits dans les établissements d'enseignement, les exportations espagnoles d'agrumes intracommunautaires, la population de l'Union européenne, etc.
Les variables qui sont représentées par des proportions ou des pourcentages peuvent apparaître dans les deux sens de manière interchangeable, bien qu'il existe une préférence généralisée pour une utilisation dans leur état d'origine (forme linéaire). En effet, le régresseur aura une interprétation différente selon que des logarithmes ont été appliqués ou non aux variables de régression. Un exemple serait la croissance annuelle de l'indice des prix à la consommation en Espagne. Le tableau ci-contre liste les différentes interprétations du régresseur, en l'occurrence une simple régression.
Interprétation des logarithmes en économétrie
Voici un tableau récapitulatif de la façon dont les logarithmes sont calculés et interprétés dans un modèle de régression économétrique.
Nous allons l'expliquer de manière plus simple, pour qu'elle soit mieux comprise.
- Le modèle Niveau-Niveau représente les variables sous leur forme originale (régression sous forme linéaire). C'est-à-dire qu'un changement d'une unité dans X affecte β1 unités à Y.
- Le modèle Level-Log est interprété comme une augmentation de 1% de changement de X est associée à un changement de Y de 0,01 · β1.
- Le modèle Log-Level est le moins fréquemment utilisé et est connu sous le nom de semi-élasticité de Y par rapport à X. Il est interprété comme une augmentation de 1 unité de X est associée à un changement de Y de (100 · β1 )%.
- Le modèle Log-Log est attribué à β1 l'élasticité de Y, par rapport à X. Elle est interprétée comme une augmentation de 1% de X est associée à un changement de Y de B1%.