En la clase de hoy hemos estado viendo las medidas de posición, donde se encuentran los cuantiles. Su
cálculo se hace para variables cuantitativas, solo tienen en cuenta la posición
de los valores (como recordatorio, lo mismo que hacía la mediana).
Dentro de los cuantiles más usados están: los percentiles,
los deciles y los cuartiles.
A continuación voy a explicar brevemente los 3 tipos de
cuantiles, seguido de un ejemplo para que os sea más fácil entenderlo.
-Percentiles: dividen
la muestra ordenada en 100 parte.
El valor P50 corresponde al valor de la mediana(50%).
Para buscar la posición de un percentil en una serie de
datos agrupados, buscamos el intervalo en el que la frecuencia relativa
acumulada(Hi) sea superior al valor del percentil.
-Deciles: dividen
la muestra ordenada en 10 partes.
El decil se puede traducir a percentil.
El valor del D5 corresponde al valor de la mediana y, por
tanto, al del P50.
D1=P10; D2=P20;…; D10=P=100
-Cuartil: dividen
la muestra en 4 partes.
Q1=P25 Q2=P50 (mediana) Q3=P75 Q4=P100
Ejemplo cálculo de cuartiles, deciles y
percentiles
En las
siguientes distribuciones de frecuencias calcular los cuartiles, los deciles 3 y
el percentil 22
X
|
fi
|
Fi
|
1
|
2
|
2
|
2
|
4
|
6
|
3
|
2
|
8
|
4
|
6
|
14
|
5
|
4
|
18
|
6
|
2
|
20
|
7
|
2
|
22
|
8
|
2
|
24
|
|
24
|
|
D3= 3*24/10=7´2
Ahora miramos en la tablita y miramos la columna de Fi, cogemos
el valor que esté por encima de 7´2 y miramos la tabla de la variable. En este
caso seria 3
D3=3
P22=22*24/100=5´28
Volvemos a mirar los mismos apartados de la tabla que
utilizamos antes para calcular el D3.
Por tanto P22=2
En el caso de que coincidiera el resultado con el número de
la columna de Fi, cogeríamos tanto el
valor que corresponde al número que hemos calculado como el valor de Fi que
esté por encima y haríamos la media.
Ejemplo:
En el caso de que P22= 22*total de f1/100=8
Cogeríamos x=3 y x=4 y haríamos la media: 3+4/2=3´5
Por tanto P22=3´5
A continuación vimos
las medidas de dispersión:
-Rango o recorrido:
diferencia entre el mayor y el menor valor de la muestra. (Esta no es
suficiente para indicar la dispersión).
| XN-X1|
-Desviación media:
Dm= media de cada
valor- media de la muestra)/ nº total de valores.
Dm=Ƹ |Xi-X|/n
Mientras más alto es el valor que nos da, más dispersa es la
media.
Desviación típica:
cuantifica el error que cometemos si representamos una muestra por su media.
S = √Ƹ (Xi-X)2/n-1
Para datos
agrupado:
S = √Ƹ fi(mc-X)2/n-1
Varianza: Expresa la
misma información en valores cuadráticos.
S2 = Ƹ (Xi-X)2/n-1
Recorrido intercuadrático: Diferencia entre el tercer y el
primer cuartil.
|Q3-Q1|
Coeficiente
de variación: Nos sirve para comparar la heterogeneidad de dos
series numéricas con independencia de las unidades de medida.
Adopta
valores entre 0 y 1
Divide la
desviación típica entre la media.
C.V = S/X
EJEMPLO:
Unas
enfermeras han registrado en el punto de vacunación las edades de nueve niños
que han sido vacunados durante una sesión, obteniéndose los siguientes datos:
3, 2, 4, 2,
1, 3, 5, 3 y 4 meses
Calcula:
a) Media
aritmética
b) Mediana
c) Moda
d) Rango o
recorrido
e) Varianza
f) Desviación
típica
g) Coeficiente
de variación.
N=9
a)
X= Ƹx (nº de
datos)/n (las observaciones)
X=
(3+2+4+2+1+3+5+3+4)/9= 27/9=3
X=3
b) Ordenamos la serie: 1, 2, 2, 3, 3, 3, 4, 4, 5.
Me=N+1/2
De esta
manera obtenemos el puesto en el que se encuentra la mediana, ya que es una
serie impar:
Me= 9+1/2=
5
Por tanto
me= 3
c)
Mo= 3
d)
R=5-1= 4
e)
S2 = Ƹ (Xi-X)2/n-1
S2=(3-3)
2+(2-3)2+(4-3)2+(2-3)2+(1-3)2+(3-3)2+(5-3)2+(3-3)2+(5-3)2+(3-3)2+(4-3)
2= 1´5
f)
S = √Ƹ (Xi-X)2/n-1
S=√ S2
S=1´22
g)
C.V = S/X
C.V=0´41=
41%
Una vez
finalizada la explicación sobre las medidas de dispersión, continuamos con las distribuciones normales, distribución de
Gauss o distribución Gaussiana ( para variables continuas)
La gráfica
es simétrica y acampana (media, mediana y moda coinciden):
Se la
conoce como campana de Gauss.
El
simbolito de la O significa desviación típica.
ASIMETRÍAS Y CURTOSIS
Nos fijamos en la posición de la
media.
Asimetrías:
Los
resultados pueden ser los siguientes:
-
g1=0
(distribución simétrica)
-
g1>0
(distribución asimétrica positiva)
-
g1<0
(distribución asimétrica negativa)
Curtosis o apuntamiento:
Mide el
grado de concentración de los valores que toma en torno a su media.
Se elige
como referencia una variable con distribución normal, coeficiente de curtosis
es 0.
Chicos no
preocuparse porque no hay que aprenderse la fórmula de g2, el resultado te lo
dan y así puedes sacar como es la distribución.
Los
resultados pueden ser los siguientes:
-
g2=0
(distribución mesocúrtica).
-
g2>0
(distribución leptocúrtica.
-
G2<0
(distribución platicúrtica).
Por fin llegamos a la parte más difícil
de este tema, la TIPIFICACIÓN DE VALORES, que solo se realiza cuando las
variables son continuas y la distribución es normal.
Para que entendáis la tipificación os
pongo un video en el que creo que se entiende fácilmente y paso a paso. En el
caso de que tengáis alguna duda ponerme un comentario y os la intentaré resolver. Un saludo a todosJ