Fonction d'autocorrélation simple - Exemple dans R

En d'autres termes, la fonction d'autocorrélation simple (FAS), ou de l'anglais, Fonction d'autocorrélation, C'est une fonction mathématique qui nous aide à savoir dans quelle mesure les données d'une période donnée dépendent des mêmes données de k périodes précédentes.

Nous générons une série temporelle annuelle X qui suit une distribution normale plus une inertie. Nous pouvons également utiliser des données réelles.

Méthodologie

Les programmes sont indispensables pour travailler sur l'analyse d'autocorrélation. Des programmes tels que Python peuvent être utilisés, mais pour l'analyse statistique et la gestion des données, nous recommandons R, ou sa version améliorée, R Studio. Ici, nous allons travailler avec R.

Calcul

Et comment écrivons-nous la formule FAS en code R ?

R et Python ont tous deux des bibliothèques où les formules sont liées à un nom. Ensuite, il suffit d'avoir installé la bibliothèque qui contient la formule que nous voulons utiliser et de l'appeler dans le script.

Dans le quion de R il faut écrire :

La fonction acf c'est à l'intérieur de la bibliothèque Statistiques.

X -> Séries temporelles que nous utilisons comme échantillon pour calculer le FAS.

acf (X, ylim = c (-1,1)) -> Fonction d'autocorrélation simple sur X avec des limites sur l'axe vertical entre -1 et 1, qui sont les valeurs que peut prendre le coefficient d'autocorrélation.

Vérification

Cette étape n'est pas nécessaire si nous avons utilisé le code précédent puisqu'il calcule lui-même les bandes de confiance.

Pour déterminer si les coefficients d'autocorrélation calculés sont statistiquement significatifs, nous devrons établir des bandes de confiance avec les valeurs critiques. De cette façon, étant donné un pourcentage de significativité, on peut dire avec certitude statistique s'il y a ou non présence d'autocorrélation dans les données.

De la même manière que le coefficient de corrélation, le coefficient d'autocorrélation suppose également la normalité et, par conséquent, nous calculerons l'intervalle de confiance comme suit :

Nous définissons le test d'hypothèse comme :

A 95% de confiance avec un niveau de signification de 5%, on retrouve le fameux 1,96 dans les tableaux normaux. La valeur critique est donnée par :

Où la variance des coefficients est donnée par l'approximation :

Bien que nous donnions la formule, nous conseillons d'utiliser des programmes statistiques pour plus de précision et de rapidité.

Résultat

Toutes les lignes se terminant en dehors de la bande de confiance signifient que la série chronologique présente une autocorrélation dans la période indiquée.

Ainsi, sur la base du graphique, nous voyons qu'il y a présence d'autocorrélation dans cette série temporelle dans les périodes où la ligne dépasse de la bande discontinue.

La première ligne qui est à 0 et tire vers 1 peut être ignorée car t doit être strictement supérieur à 0 et dans ce cas il ne l'est pas. Cela n'a pas beaucoup de sens d'avoir à faire toutes les étapes précédentes pour connaître l'autocorrélation de maintenant avec maintenant car nous la connaissons déjà : la corrélation d'une variable avec elle-même est 1, donc nous avons déjà la réponse.