Notas preliminares
Recordatorio
Se dispone de un número de datos n sobre una muestra de medidas,
resultados, personas, objetos... Cada dato lo constituye uno (una
variable x) o dos números (dos variables x e y). Se desea calcular la
media de estos datos y la distribución de los mismos en función de la
media, es decir, la desviación típica.
Dichos datos se calculan a partir de los totales anotados :
∑x = x
+x
+x
+....x
1
∑x
= x
+x
+x
1
∑xy = x
y
+x
y
1
1
Media
desviación típica / desviación estándar muestral para x :
desviación típica / desviación estándar poblacional para x:
varianza V = s2 o
Cuando se utilizan dos variables, se intentará deducir de los datos
una relación entre x e y. Estudiaremos a continuación la solución más
simple: contamos con una relación de tipo y=a+bx.
cov(x, y) es la covarianza :
La validez de esta hipótesis se verifica mediante el cálculo siguiente :
denominada coeficiente de correlación lineal. El resultado sigue
estando entre –1 y +1 y se considera como válido un resultado con
valor absoluto superior o equivalente a √3/2.
Copyright © Lexibook 007
5. FUNCIONES ESTADÍSTICAS
+x
n-1
n
+....x
+x
n-1
n
+x
y
+....x
y
n-1
n-1
2
+x
y
n
n
6