Commentaires préliminaires
Pour mémoire
On dispose de n données sur un échantillon de mesures, résultats,
personnes, objets... Chaque donnée est constituée d'un nombre (une variable
x) ou deux (deux variables x et y). On cherche à calculer la moyenne de ces
données et la répartition de ces données autour de la moyenne, l'écart-type.
Ces données se calculent à partir de sommes que l'on notera :
∑x = x
+x
+x
+....x
1
2
3
∑x
= x
+x
+x
+....x
2
2
2
2
1
2
3
∑xy = x
y
+x
y
+x
1
1
2
2
3
Moyenne
x= ∑x /n .
écart type / déviation standard de l'échantillon pour x :
n
√
∑(x
s =
i=1
n - 1
écart type / déviation standard de la population pour x :
n
√
∑(x
=
i=1
o
variance V = s
ou
2
Lorsqu'il y a une variable, et que sa répartition est gaussienne (courbe en
forme de cloche) on peut effectuer des calculs de densité de probabilité,
c'est-à-dire déterminer quel pourcentage de la population se trouve entre deux
valeurs limites de x.
Lorsqu'on a deux variables on essaie de déduire des données une relation
entre x et y. On étudie la solution la plus simple : une relation de type y=A+Bx.
La validité de cette hypothèse est vérifiée par le calcul d'un coefficient appelé
coefficient de corrélation linéaire. Le résultat est toujours entre –1 et +1 et on
considère bon un résultat supérieur ou égal à √3/2 en valeur absolue. Si la
régression linéaire n'est pas vérifiée on peut étudier d'autres types de relation
entre x et y, en particulier :
logarithmique : y = A + Blnx
exponentielle : y = A e
puissance : y = A x
inverse : y = A + B/x
quadratique : y = A + Bx +Cx
46
6. STATISTIQUES
+x
n-1
n
+x
2
2
n-1
n
y
+....x
y
+x
y
3
n-1
n-1
n
n
√
-x)
2
=
∑x
1
√
-x)
2
=
∑x
1
n
2
o
Bx
B
2
n
- (∑x)
/
2
2
n - 1
n
- (∑x)
/
2
2
n
Copyright © Lexibook 007