lunes, 26 de octubre de 2015

TABLAS DE FRECUENCIA.

TABLAS DE FRECUENCIA.

Objetivos: aprender a agrupar los datos para facilitar los cálculos de los estadígrafos.

Cuando los datos estadísticos de que se dispone son numerosos, es difícil realizar cálculos sobre ellos. Por esta razón se organizan en tablas de manera de facilitar el trabajo.

Una tabla de frecuencia es la ordenación de la información obtenida de una muestra, en el estudio de una sola variable.

Cuando se dispone de un gran número de datos, es útil distribuirlos en categorías dentro de una tabla para facilitar el análisis. Se explicara con  un ejemplo:

1.    Veamos el caso de una variable discreta, pero antes se mencionaran las siguientes notaciones:

Ejemplo: en una encuesta de presupuesto familiar, se ha obtenido la siguiente información respecto al n° de hijos en 2 familias.
Variable x = n° de hijos
Los datos son los siguientes:


3, 1, 2, 0, 3, 2, 1, 1, 3, 3, 2, 4, 2, 2, 0, 2, 1, 3, 4, 2, 3
                                                                                    
x1  x2                                                                           x21


Vemos que la variable x toma valores entre 0 y 4, es decir, existen en este grupo 5 categorías o clases. Contamos el número de familias en cada categoría y formamos la tabla.
Tabla 1.

Categorías Xi
Frec. Absoluta fi
Frec. Absoluta Acum.
Fi
Frec. Relativa hi
Frec. Rel. Acum.
Hi
0
f1 = 2
f1 = 2
f1/n = 0.095
h1      = 0.095
1
f2 = 4
f1 + f2 = 6
f2/n = 0.190
h1 + h2 = 0.286
2
f3 =  7
f1 + f2 + f3 = 13
f3/n = 0.333
h1 + h2 + h3 = 0.619
3
f4 = 6
f1 +.......+ f4   = 19
f4/n = 0.285
h1 +......+ h4 = 0.904
4
f5 = 2
f1 +.......+ f5    = 21
f5/n = 0,095
h1 +......+ h5 = 1,000
Total
n = 21

1.000



n       = tamaño de la muestra
Xi      valor de la variable en el individuo i
fi       frecuencia absoluta: de veces que se repite la variable en la categoría   i
Fi      frecuencia  absoluta  acumulada.  Indica  el     de  individuos  hasta        la
categoría i
hi      frecuencia   relativa.  Porcentaje  de  la  categoría   respecto  del  total,     se obtiene  dividiendo la frecuencia de la clase por el tamaño de la  muestra.
Hi      frecuencia relativa acumulada. Porcentaje  acumulado

Observamos algunos detalles importantes:

i)             n es la suma de la columna fi, es decir, siempre debe dar como resultado el tamaño de la muestra.
ii)            En la columna de frecuencia absoluta acumulada se va  sumando  los valores de la columna fi, por lo tanto el último valor debe ser igual a n.
iii)           La columna frecuencia relativa (hi) representa en % de familias en cada categoría. Por ejemplo, en las categorías con 3 hijos a un  28.5%  de familias. Esta columna debe sumar 1.
iv)          La Hi acumula los valores de la frecuencia relativa, por lo tanto el último valor debe ser 1. Ejemplo H4: el 90.4% de las familias encuestadas tienen a los más 3 hijos.
2.    En el caso de analizar una variable continua, la tabla de frecuencia cambia sólo en el comienzo. También sé vera en un ejemplo:

Salarios semanales de 40 personas en miles de  pesos.

90
62
102
85
92
106
110
95
105
112
108
86
110
68
118
99
98
74
91
80
80
100
79
93
93
104
77
106
98
73
95
85
91
83
67
119
108
115
74
88

Efectuemos previamente los siguientes pasos.

i)             Se busca el valor mínimo y el valor máximo       Xmín  = 62     Xmáx = 119
ii)            Se calcula el rango: 119 – 62 = 57.
Rango: en todo conjunto de valores estadísticos hay valores extremos: el menor de todos y el mayor de todos; la diferencia entre estos valores extremos se llama rango.

iii)           La cantidad de intervalos no debe ser menor de 5 ni mayor de 18. Por lo general tiene el mismo ancho. Una forma de calcular el de intervalos para  generar  la  tabla  de  frecuencias  es  mediante  la  siguiente  formula: k = 1 + 3.322 x log (40) = 6.322 usamos k 6

iv)          Se calcula la amplitud de cada intervalo c = rango / k = 57 / 6 = 9.5 10
  
v)           Se construye la tabla:

Tabla 2.
Intervalos Yi-1 – Yi+1
Marca de clase
Y1
Frec. Absoluta fi

Fi

hi

Hi
[60 – 70)
65
3
3
0,075
0,075
[70 – 80)
75
5
8
0,125
0,20
[80 – 90)
85
7
15
0,175
0,375
[90 – 100)
95
11
26
0,275
0.62
[100 – 110)
105
8
34
0,20
0,85
[110 – 120)
115
6
40
0,15
1,00
Total

40

1,00


El resto de las columnas se forman de la misma manera que la tabla 1.                 n=  tamaño de la muestra
Xi      valor de la variable en el individuo i
fi       frecuencia absoluta: de veces que se repite la variable en la categoría   i
Fi frecuencia   absoluta   acumulada.   Indica   el      de   individuos   hasta la categoría i

hi      frecuencia   relativa.  Porcentaje  de  la  categoría  respecto  del  total,      se obtiene  dividiendo la frecuencia de la clase por el tamaño de la  muestra.

Hi      frecuencia relativa acumulada. Porcentaje  acumulado

Yi = marca de clase: su valor es igual a la mitad de la suma de los limites inferior y superior del intervalo de clase. En todos los análisis estadísticos su supone que el valor de la marca de una clase es el valor que corresponde asignar a cada uno de los elementos ubicados en ese intervalo.

C      =  amplitud del intervalo: la diferencia entre los limites reales de un  intervalo. 
Yi-1     =  limite inferior del intervalo
Yi+1   =  limite superior del intervalo

Ejercicios.


1.  En una cierta ciudad se ha tomado una muestra representativa del total de familias que en ella viven y se ha anotado el número de hijos de cada una. Los valores de esta variable son los siguientes:

0
1
0
4
2
2
1
2
3
2
3
2
1
3
4
2
2
3
2
1

a)  Diga qué tipo de datos son estos.

b)  Construya una tabla de frecuencias correspondiente a este ejercicio.


2.  Se visitaron 25 empresas citrícolas de una cierta zona y en cada una se anotó la cantidad de plantas atacadas por un cierto hongo, de lo cuál resultaron los siguientes datos:

15
20
25
15
18
16
17
18
20
18
18
18
19
16
17
19
16
17
17
17
19
18
19
18
15




a)  Diga qué tipo de datos son estos.
b)  Construya una tabla de frecuencias correspondiente a este ejercicio.

3.  Determine para el ejercicio 1 la frecuencia relativa de familias con 2 hijos o menos y la frecuencia relativa de familias que tienen más de 2 hijos y no más de 4.

4.  Determine para el ejercicio 2 la frecuencia relativa de empresas citrícolas que tienen 18 o menos plantas atacadas por el hongo. Calcule también la frecuencia relativa de empresas citrícolas que tienen no menos de 18 plantas atacadas por el hongo.

5.  El gerente de personal de una compañía registró el número de días que sus 50 empleados habían tomado como licencia por enfermedad.

10
35
12
8
44
6
15
20
5
7
5
11
17
8
4
7
25
9
2
10
12
12
3
10
9
3
5
16
31
9

0
4
7
11
3
18
2
10
6
22

2
9
8
29
6
4
7
10
0
1

a)    Identificar la variable y su clasificación.
b)    Construir una tabla de frecuencia apropiada a estos datos.

6.  Dada la siguiente tabla de frecuencias:

Clases
fi
9 – 12
2
12 – 15
1
15 – 18
2
18 – 21
5
21 – 24
8
24 – 27
11
27 – 30
7
30 – 33
4
33 – 36
5
36 – 39
2

a)  Determine las marcas de clases y la amplitud de las clases.

b)  Determine las frecuencias absolutas acumuladas.

c)  Determine las frecuencias relativas.

d)  Determine las frecuencias relativas acumuladas.


7.  En la tabla de frecuencia que se da a continuación faltan datos, complétela.

Valores
fi
Fi
hi
Hi
0

2


1

5


2

9


3

14

0.7
4


0,2

5




Totales





1 comentario: