lunes, 26 de octubre de 2015

Estadígrafos de dispersión

Estadígrafos de dispersión.

I.                 Objetivos de la sesión: que el alumno aprenda a calcular e interpretar los diferentes estadígrafos de dispersión.

1.  Estadígrafos de dispersión.

La idea de dispersión se relaciona con la mayor o menor concentración de los datos en torno a un valor central, generalmente la media  aritmética.

1.1  Varianza:

Es la media aritmética de los cuadrados de las desviaciones. Se denota por S2. Este valor cuantifica el grado de dispersión o separación de los valores de la distribución con respecto a la media aritmética. A mayor dispersión mayor valor de la varianza, a menor dispersión menor valor de la varianza.

-     Datos no tabulados: tomamos como ejemplo los siguientes  datos.

5, 8, 6, 7, 5, 6, 5
en primer lugar, se debe calcular el  promedio   aritmético: X = 5 + 8 +...5 ) /7= 42 / 7= 6

La fórmula para calcular la varianza es

S= (5 – 6)+ (8 – 6)+ (6 – 6)+... + (5 – 6)2
                                                            7

S= 1 + 4 + 0+... + 1 8 = 1,14
                    7                    7

se puede calcular la varianza por una fórmula mas reducida que la  anterior:


          å
Xi               
S = i=1          - X 2
n
n ejemplo:


 X   5        
    4
6
8
8
6
5

 25
    16
36
64
64
36
25
= 266

 
S ²  =  266 - (6)² =2,0
           7


- Datos tabulados: en los de tener los datos en una tabla de frecuencia, el calculo de la varianza se hace a través de la siguiente fórmula.
 Para el ejemplo se usara la tabla 2, que se vuelve a repetir en este  capitulo:


Intervalos Yi-1 Yi+1
Yi
fi
Yi2
Y 2 · f
i          i
[60 – 70)
   65
3
4225
   12675
[70 – 80)
  75
5
5625   
   28125
[80 – 90)  
  85
7
7225
   50575
[90 – 100)
   95
11
9025
   99275
[100 – 110)
  105
8
11025
   88200
[110 – 120)
  115
6
13225
   72350


40

351200



  = 351200 (93,5)2
              40

  = 8780 – 8742,25
  = 37,75

·    Propiedades de la varianza.

1)     La varianza es siempre un valor positivo
n
  = å  (X– X)²=0
i = 1
2)    Sea Y = a ± x, entonces V(Y) = V(a ± x) = V(x). Si a una variable se le suma o resta una constante, la varianza permanece igual.

3)    Sea Y = a·x, entonces V(Y) = V(a·x) = a2 V(x). Si una variable se le multiplica por una constante, la varianza cambia multiplicándose por la constante al cuadrado.


Ejemplo: 80 empleados de una compañía tienen un sueldo promedio de $125.000 y una varianza de $12.000. Si reciben un reajuste del 20%, calcular la nueva varianza.

Si se realizara un reajuste del 20% la constante será 1,2

V(x · 1,2) = (1,2)²  · V(x)
= 1,44 · 12.000
= $17.280


2.2    Desviación estándar:

Se designa la varianza por la letra S y se define como la raíz de la  varianza.
S =  √S ²
En el ejemplo de la tabla 2 la desviación estándar es  S = √254                = 14,28

La desviación estándar es mas usada que la varianza. Una de sus utilidades es medir la concentración de los datos respecto a la media  aritmética.
Para distribuciones normales:
                               


-     el 68,27% de los datos están comprendidos en el rango S+ S
-     el 95,45% de los datos están comprendidos en el rango  2S+ 2S 
-     el 99,73% de los datos están comprendidos en el rango 3S+ 3S


2.3     Coeficiente de variación:

Las medidas de dispersión que se han estudiado anteriormente son medidas absolutas y se expresan en las mismas unidades con las que se mide la  variable.
Si se necesita comparar dos o más grupos de datos medidos con diferentes unidades, por lo general, no es posible la comparación utilizando la dispersión absoluta. Por ejemplo, una serie de precios en dolares con una serie de precios en pesos.
Para estos casos se usa la dispersión relativa:

Dispersión relativa = dispersión absoluta
                                           Media

Si en el caso particular de usar la desviación estándar (S) como dispersión absoluta y la media aritmética ( X ), recibe el nombre de coeficiente de  variación:

Ejemplo: Supongamos que un grupo de profesionales de una empresa A tienen un sueldo promedio de $500.000 y una varianza de $12.000. En otra empresa, B, otro grupo de profesionales tienen un sueldo de $600.000 y una desviación de $18.000.

C= 12.000  · 100 = 2,4
500.000

C= 18.000 · 100 = 3,0                  presenta mayor dispersión 
            600.000

Ejemplo: Un curso dio un examen de estadísticas y otro un examen de álgebra con los siguientes resultados:

Estadística                                           Algebra
                                                                                                                                                                                                                       


= 78                                             X  = 73
S = 8,0                                             = 7,6 
¿ Qué curso tuvo mayor dispersión?


 COEF (estadística) 8   = 0,1025
                                  78


COEF (á lg ebra) = 7,6 = 0,1041
                                       73
El curso que dio el examen de álgebra tuvo mayor dispersión.


2.4   Desviación media.

La desviación media es una medida de dispersión bastante objetiva, es decir mientras mas dispersos están los datos mayor es la desviación media, pero no muestra si están bajo  X , ya que tomamos su valor absoluto.

-     Datos no tabulados:

En el ejemplo para la tabla 2 el calculo de DM es el siguiente, sabiendo que

= 93,5

Intervalos Yi-1 – Yi+1
Marca de clase
Y1
Frec. Absoluta fi
X i   - X
X - × fi

[60 – 70)

 65

3

28,5

85,5
[70 – 80)
75
5
18,5
92,5
[80 – 90)
85
7
8,5
59,5
[90 – 100)
95
10
1,5
15,0
[100 – 110)
105
9
11,5
103,5
[110 – 120)
115
6
21,5
129,0
Total

40

485


DM  =  485 = 12,125
40


2.5   Variable normalizada o estandarizada.

A diferencia del coeficiente de variación, que compara dos grupos, esta variable sirve para comparar un individuo dentro de su mismo grupo. Su fórmula es:

Z =  X- X

Ejemplo: Un curso dio un examen de estadísticas y otro un examen de álgebra con los siguientes resultados:

Estadística                                           Algebra
= 78                                                           X = 73
S = 8.0                                                            = 7,6

Un estudiante que dio ambos exámenes saco 75 puntos en estadísticas y 71 en álgebra. ¿En qué asignatura tuvo mejor resultado respecto a su curso.?

Z (estadístics) = 75 - 78 = -0,375
8
Z (á lg ebra) = 71 - 73 = -0,263
7,6
En álgebra el alumno tuvo menor dispersión respecto al promedio del  curso

 III.          Actividad previa: leer textos indicados en bibliografía, referentes al tema.


IV.           Actividad post sesión: realizar la guía de ejercicios que a continuación se presenta.




Ejercicios.


1.    Supongamos que un grupo de profesionales en un país A tienen un salario promedio de US$26.888 y varianza US$14.400. En un país B otro grupo de profesionales con iguales características reciben un salario promedio de US$8.570 con desviación estándar de US$80. ¿Cuál grupo  de  salarios presenta una menor variabilidad?.


2.    En un inventario realizado en la bodega de un almacén se encontraron 200 artículos que fueron importados a diferentes precios (en dólares)


Xi
fi
20,5
20
32,0
30
48,6
50
50,0
60
60,4
40

200

a)    Calcular la desviación estándar.

b)    Calcular le desviación media.

c)    Calcular coeficiente de variación.


3.    En el primer semestre de este año 30 empresas tuvieron en promedio $374 millones en gastos con una varianza de $80 millones. Por un error cada una de las empresas no contabilizó $7 millones en los gastos. Corregir el promedio y la varianza.


4.    80 empleados de una compañía tiene un salario promedio de $125.000 y una varianza $12.000. Si reciben un reajuste del 20%. Calcular el nuevo promedio y varianza.

5.    Se administra un antibiótico al ganado para combatir cierta enfermedad, el peso (en gramos) del antibiótico depende del peso del animal, el cual debe ser medido con mucha precisión, puesto que una sobredosis puede ser perjudicial para el animal. A continuación se muestra la distribución de frecuencia del peso de las dosis.

Peso (gramos)
fi
15 – 20
7
20 – 25
25
25 – 30
31
30 – 35
20
35 – 40
11

a)    Calcular los estadígrafos de posición y dispersión que le parezcan adecuados (no todos), explique su decisión.

b)    Investigadores afirman que una dosis con peso mayor o igual a 30 gr. sería peligroso. Según la información de que dispone, ¿qué porcentaje de la dosis se clasifica como peligrosa?.

c)    Construya histograma y polígono de frecuencias asociado a los datos.


No hay comentarios:

Publicar un comentario