e
Commentaires préliminaires
H
H
H
z
s
la
he
Lorsqu'on a deux variables on essaie de déduire des données une
relation entre x et y. On étudie la solution la plus simple : une relation de
type y=a+bx.
cov(x,y) est la covariance :
La validité de cette hypothèse est vérifiée par le calcul suivant :
appelé coefficient de corrélation linéaire. Le résultat est toujours entre
–1 et +1 et on considère bon un résultat supérieur ou égal à √3/2 en valeur
absolue.
Copyright © Lexibook 2007
Pour mémoire
On dispose de n données sur un échantillon de mesures, résultats,
personnes, objets... Chaque donnée est constituée d'un nombre (une
variable x) ou deux (deux variables x et y). On cherche à calculer la
moyenne de ces données et la répartition de ces données autour de la
moyenne, l'écart-type.
Ces données se calculent à partir de sommes que l'on notera :
∑x = x
+x
+x
+....x
+x
1
2
n-1
∑x
2
= x
2
+x
2
+x
2
+....x
1
2
n-1
∑xy = x
y
+x
y
+x
y
+....x
1
1
2
2
Moyenne
écart type / déviation standard de l'échantillon pour x :
écart type / déviation standard de la population pour x :
2
2
variance = s
ou
cov(x,y)
y
(x - x) + y
V(x)
1
(x
cov(x,y)
n
i=1
cov(x,y)
6. STATISTIQUES
n
2
+x
2
n
y
+x
y
n-1
n-1
n
n
1
- x) (y
- y)=
i
i
n
xy-xy