Statistiques non paramétriques
Les statistiques non paramétriques sont une branche de l'inférence statistique dont les calculs et les procédures sont basés sur des distributions inconnues.
Les statistiques non paramétriques ne sont pas très populaires. Cependant, il existe une littérature très abondante à ce sujet. Le problème que les statistiques non paramétriques visent à résoudre est le manque de connaissance de la distribution de probabilité.
En d'autres termes, les statistiques non paramétriques tentent de découvrir la nature d'une variable aléatoire. Car, une fois que vous savez comment il se comporte, effectuez les calculs et les métriques qui le caractérisent.
C'est le but des statistiques non paramétriques. Nous le voyons plus en détail ci-dessous.
Objectif des statistiques non paramétriques
Il existe différents types de distributions de probabilité sur lesquelles fonctionnent les statistiques paramétriques. Or, quand on ne sait pas à quel type de distribution de probabilité correspond une variable, quels calculs utilise-t-on ?
Autrement dit, lorsque nous ne connaissons pas la distribution de probabilité d'un ensemble de données, nous devons faire des inférences statistiques avec des procédures non paramétriques.
En d'autres termes, si nous ne savons pas quel type de distribution de probabilité a un phénomène, nous ne pouvons pas faire d'estimations comme si nous savions vraiment comment il est distribué. C'est l'objectif des statistiques paramétriques, de nous permettre de connaître la distribution pour pouvoir passer à l'étape suivante (statistiques paramétriques).
Tests non paramétriques
Bien sûr, si on ne sait pas comment se distribue un phénomène aléatoire, que faire ? Très simple. Notre mission sera d'essayer de savoir comment il est distribué. Pour essayer de découvrir quel type de distribution a un certain phénomène, nous avons une série de tests disponibles pour nous aider à le faire. Parmi les tests non paramétriques les plus populaires figurent :
- Test binomial
- Test d'Anderson-Darling
- Le test de Cochran
- Test de Cohen kappa
- Test de Fisher
- Test de Friedman
- Le test de Kendall
- Test de Kolmogórov-Smirnov
- Test de Kuiper
- Test de Mann-Whitney ou test de Wilcoxon
- Test de McNemar
- Test médian
- Test de Siegel-Tukey
- Test des signes
- Coefficient de corrélation de Spearman
- Tableaux croisés
- Essai de Wald-Wolfowitz
- Test de classement signé Wilcoxon
Tous ces tests ont pour but de nous dire si une variable aléatoire est distribuée d'une manière ou d'une autre. Par exemple, un résultat possible pourrait être : la variable aléatoire X est distribuée au taux d'une distribution normale.
Cela étant dit, les résultats ne sont pas infaillibles. Pour effectuer des tests non paramétriques, nous devons disposer d'échantillons statistiques. Par conséquent, les résultats peuvent être fiables, mais ils n'ont pas besoin d'être parfaits à 100 %.