Commentaires préliminaires
Pour mémoire
On dispose de n données sur un échantillon de mesures, résultats,
personnes, objets... Chaque donnée est constituée d'un nombre (une
variable x) ou deux (deux variables x et y). On cherche à calculer la
moyenne de ces données et la répartition de ces données autour de la
moyenne, l'écart-type.
Ces données se calculent à partir de sommes que l'on notera :
∑x = x
+x
+x
+....x
1
∑x
= x
+x
+x
1
∑xy = x
y
+x
y
1
1
Moyenne
écart type / déviation standard de l'échantillon pour x :
écart type / déviation standard de la population pour x :
variance V = s2 ou
Lorsqu'on a deux variables on essaie de déduire des données une
relation entre x et y. On étudie la solution la plus simple : une relation
de type y=a+bx.
cov(x,y) est la covariance :
La validité de cette hypothèse est vérifiée par le calcul suivant :
appelé coefficient de corrélation linéaire. Le résultat est toujours entre
–1 et +1 et on considère bon un résultat supérieur ou égal à √3/2 en
valeur absolue.
4
5. STATISTIQUES
+x
n-1
n
+....x
+x
n-1
n
+x
y
+....x
y
n-1
n-1
2
+x
y
n
n
Copyright © Lexibook 007