Notas preliminares
H
H
H
a
Al utilizar dos variables, se intentará deducir de los datos una relación entre
x e y. Estudiaremos a continuación la solución más simple: contamos con
una relación de tipo y=a+bx.
cov(x,y) es la covarianza:
La validez de esta hipótesis se verifica mediante el cálculo siguiente:
o a
denominada coeficiente de correlación lineal. El resultado sigue estando
entre –1 y +1 y se considera como válido un resultado con valor absoluto
superior o equivalente a √3/2.
Copyright © Lexibook 2007
6. FUNCIONES ESTADÍSTICAS
Recordatorio
Se dispone de un número de datos n sobre una muestra de medidas,
resultados, personas, objetos... Cada dato lo constituye uno (una
variable x) o dos números (dos variables x e y). Se desea calcular la
media de estos datos y la distribución de los mismos en función de la
media, es decir, la desviación típica.
Dichos datos se calculan a partir de los totales anotados:
∑x = x
+x
+x
+....x
+x
1
2
n-1
∑x
2
= x
2
+x
2
+x
2
+....x
1
2
n-1
∑xy = x
y
+x
y
+x
y
+....x
1
1
2
2
Media
desviación típica / desviación estándar muestral para x:
desviación típica / desviación estándar poblacional para x:
2
2
varianza = s
ou
cov(x,y)
y
(x - x) + y
V(x)
1
(x
cov(x,y)
n
i=1
cov(x,y)
n
2
+x
2
n
y
+x
y
n-1
n-1
n
n
1
- x) (y
- y)=
i
i
n
xy-xy