lunes, 1 de junio de 2015

15-MAYO

En la clase de hoy hemos estado viendo las medidas de posición, donde se encuentran los cuantiles. Su cálculo se hace para variables cuantitativas, solo tienen en cuenta la posición de los valores (como recordatorio, lo mismo que hacía la mediana).

Dentro de los cuantiles más usados están: los percentiles, los deciles y los cuartiles.
A continuación voy a explicar brevemente los 3 tipos de cuantiles, seguido de un ejemplo para que os sea más fácil entenderlo.

-Percentiles: dividen la muestra ordenada en 100 parte.
El valor P50 corresponde al valor de la mediana(50%).
Para buscar la posición de un percentil en una serie de datos agrupados, buscamos el intervalo en el que la frecuencia relativa acumulada(Hi) sea superior al valor del percentil.

-Deciles: dividen la muestra ordenada en 10 partes.
El decil se puede traducir a percentil.
El valor del D5 corresponde al valor de la mediana y, por tanto, al del P50.
D1=P10; D2=P20;…; D10=P=100

-Cuartil: dividen la muestra en 4 partes.
Q1=P25 Q2=P50 (mediana) Q3=P75 Q4=P100

Ejemplo cálculo de cuartiles, deciles y percentiles    
 En las siguientes distribuciones de frecuencias calcular los cuartiles, los deciles 3 y el percentil 22

X
fi
Fi
1
2
2
2
4
6
3
2
8
4
6
14
5
4
18
6
2
20
7
2
22
8
2
24

24



D3= 3*24/10=7´2
Ahora miramos en la tablita y miramos la columna de Fi, cogemos el valor que esté por encima de 7´2 y miramos la tabla de la variable. En este caso seria 3
D3=3
P22=22*24/100=5´28

Volvemos a mirar los mismos apartados de la tabla que utilizamos antes para calcular el D3.
Por tanto P22=2
En el caso de que coincidiera el resultado con el número de la  columna de Fi, cogeríamos tanto el valor que corresponde al número que hemos calculado como el valor de Fi que esté por encima y haríamos la media.

Ejemplo:
En el caso de que P22= 22*total de f1/100=8
Cogeríamos x=3 y x=4 y haríamos la media: 3+4/2=3´5
Por tanto P22=3´5

A continuación vimos las medidas de dispersión:
-Rango o recorrido: diferencia entre el mayor y el menor valor de la muestra. (Esta no es suficiente para indicar la dispersión).
| XN-X1|

-Desviación media:
Dm= media de cada valor- media de la muestra)/ nº total de valores.
            Dm=Ƹ |Xi-X|/n

Mientras más alto es el valor que nos da, más dispersa es la media.

Desviación típica: cuantifica el error que cometemos si representamos una muestra por su media.
      S = √Ƹ (Xi-X)2/n-1
Para datos agrupado:
S = √Ƹ fi(mc-X)2/n-1

Varianza: Expresa la misma información en valores cuadráticos.
            S2 = Ƹ (Xi-X)2/n-1

Recorrido intercuadrático: Diferencia entre el tercer y el primer cuartil.
            |Q3-Q1|

Coeficiente de variación: Nos sirve para comparar la heterogeneidad de dos series numéricas con independencia de las unidades de medida.
Adopta valores entre 0 y 1
Divide la desviación típica entre la media.
            C.V = S/X

EJEMPLO:
Unas enfermeras han registrado en el punto de vacunación las edades de nueve niños que han sido vacunados durante una sesión, obteniéndose los siguientes datos:
3, 2, 4, 2, 1, 3, 5, 3 y 4 meses
Calcula:
a)     Media aritmética
b)     Mediana
c)      Moda
d)     Rango o recorrido
e)     Varianza
f)       Desviación típica
g)     Coeficiente de variación.
N=9

a)      X= Ƹx (nº de datos)/n (las observaciones)
X= (3+2+4+2+1+3+5+3+4)/9= 27/9=3
X=3

b) Ordenamos la serie: 1, 2, 2, 3, 3, 3, 4, 4, 5.
Me=N+1/2
De esta manera obtenemos el puesto en el que se encuentra la mediana, ya que es una serie impar:
Me= 9+1/2= 5
Por tanto me= 3

c)      Mo= 3

d)     R=5-1= 4

e)      S2 = Ƹ (Xi-X)2/n-1
S2=(3-3) 2+(2-3)2+(4-3)2+(2-3)2+(1-3)2+(3-3)2+(5-3)2+(3-3)2+(5-3)2+(3-3)2+(4-3) 2= 1´5

f)       S = √Ƹ (Xi-X)2/n-1
S= S2
S=1´22

g)      C.V = S/X
C.V=0´41= 41%

Una vez finalizada la explicación sobre las medidas de dispersión, continuamos con las distribuciones normales, distribución de Gauss o distribución Gaussiana ( para variables continuas)

La gráfica es simétrica y acampana (media, mediana y moda coinciden):


Se la conoce como campana de Gauss.

El simbolito de la O significa desviación típica.

ASIMETRÍAS Y CURTOSIS




Nos fijamos en la posición de la media.

Asimetrías:

Los resultados pueden ser los siguientes:
-          g1=0 (distribución simétrica)
-          g1>0 (distribución asimétrica positiva)
-          g1<0 (distribución asimétrica negativa)



Curtosis o apuntamiento:

Mide el grado de concentración de los valores que toma en torno a su media.
Se elige como referencia una variable con distribución normal, coeficiente de curtosis es 0.
Chicos no preocuparse porque no hay que aprenderse la fórmula de g2, el resultado te lo dan y así puedes sacar como es la distribución.
Los resultados pueden ser los siguientes:
-          g2=0 (distribución mesocúrtica).
-          g2>0 (distribución leptocúrtica.
-          G2<0 (distribución platicúrtica).








Por fin llegamos a la parte más difícil de este tema, la TIPIFICACIÓN DE VALORES, que solo se realiza cuando las variables son continuas y la distribución es normal.

Para que entendáis la tipificación os pongo un video en el que creo que se entiende fácilmente y paso a paso. En el caso de que tengáis alguna duda ponerme un comentario  y os la intentaré resolver. Un saludo a todosJ







No hay comentarios:

Publicar un comentario