Estadígrafos de posición.
Objetivos del
tema: que el estudiante aprenda
a calcular e interpretar los diferentes estadígrafos de posición.
1.
Estadígrafos de posición:
Los estadígrafos de posición o de tendencia central
son valores que se ubican al centro de un conjunto
de datos ordenados según su magnitud. Existen varios de estos estadígrafos y se estudiaran de a uno, considerando si los datos se tienen no tabulados o tabulados
1.1 Media
aritmética o promedio:
- DATOS NO TABULADOS: se define como el cociente
que se obtiene al dividir la suma de los valores de la variable por el n° de observaciones.
Su fórmula es
la siguiente:
å Xi
X = i=1
n
n
Ej. Edades de las personas
10, 18, 21, 32, 17, 27, 28, 20, 35, 31 n
= 10

10 10
- DATOS TABULADOS: se usara los 40 datos de sueldo (tabla 2) en este caso se usa la
siguiente fórmula:
k
åYi × ni
X = i=1
n

40 40
También se
llama media ponderada.
Si se sumara
los 4 datos sueltos, el resultado daría 3697/40 = 92,4
Esta diferencia se produce porque al estar tabulados se pierde el valor real de cada dato, ya que se encasilla en un intervalo
y es reemplazado por la marca de clase.
Ej. Un
inversionista tiene 1.200 acciones cuyo valor promedio es $34 y 800 acciones
cuyo valor promedio es $45. El valor promedio de las 2.000 acciones es:



1.200 + 800 2.000
Propiedades de la media aritmética.
a)
La
media de una constante es igual a la constante
Ej. Si
los datos son 5, 5, 5, 5, 5, 5, 5 n=7

X = 5 + 5 +
5 + 5 + 5 + 5 + 5 = 7 ×
5 = 5
7 7
b) La media
de los valores que son multiplicados por una constante
es igual a la constante por la media de los dato
å X i * K å X i
å X i * K å X i
n n
Ej. sueldos en miles de Bolivianos de 10personas.
100, 120, 119, 121, 122, 150, 135, 125, 145, 105
n
å Xi
X =
= 100 + 120 + 119 +... + 105 = 1242
= 124, 2


10 10 10
Supongamos que se produce
un aumento de un 10% a todos
los sueldos ¿cómo
varia el promedio?
n
å X
i ×1,1
i=1 = 100 ·
1,1 + 120 · 1,1 + 119 ·
1,1 +... + 1,1 ·
105
10
10
= 1, 1 (100
+ 120 +... + 105)
10
= 1, 1· 124, 2 = 136,
62
c) La suma de las desviaciones de cada dato respecto al promedio de siempre cero.
5

i = 1

5
å (Xi – X) =
(26 – 29) + (35 – 29) + (24 – 29) + (32 – 29)
+ (28 – 29)
i
= 1 =
(26 + 35 + 24 + 32 + 28) – (29 + 29 + 29 + 29 + 29)
= 145 – 145= 0
1.2. Mediana:
Es otra medida
de posición o tendencia central.
Se define como aquel valor de la variable que supera la mitad de las observaciones y a su vez es superado por la otra mitad de ellas. Por esta razón, se la considera como el valor central, ya que se divide a los datos en 2 grupos (las observaciones deben estar ordenadas
de mayor a menor).
- Datos no tabulados: se ordenan las observaciones de menor a
mayor y se ubica el valor central. Si la constante
de datos (n) es par, se promedian los 2 valores
centrales. En cambio,
si n es impar habrá solo un
valor en el centro.
Ej. 3, 4, 4,
5, 6, 8, 8, 8, 10 n
= 9 (n
impar)
Mediana
5, 5, 7, 9, 11, 12, 15, 18 n = 8 (n par)
9 + 11 = 10 mediana
2
- Datos tabulados: si los datos
están tabulados no es posible
individualizar el valor de la mediana, pero si es factible
determinar el intervalo donde se encuentra.
La fórmula para encontrar la mediana es:
|
æ n ö

Me = Li + Cç 2 ÷
|
ç f ÷
ç ÷
Dónde: Li = límite inferior del intervalo (Yi-1) C = amplitud del intervalo
Fi –1 = frecuencia absoluta acumulada anterior
fi = frecuencia absoluta del intervalo
Para encontrar el intervalo donde está “Me”, se debe calcular n/2 y
buscar en la columna Fi, el valor que sugiere n/2.
Ej.: tabla 2
n = 40 = 20
2 2
En la columna Fi, el 4° intervalo supera a 20. El cálculo de Me es el siguiente:
En la columna Fi, el 4° intervalo supera a 20. El cálculo de Me es el siguiente:
Me
= 94,
54
($94.540 es el sueldo
medio)
Su
interpretación es el 50% inferior de la muestra, gana menos de $94.540 y el
otro 50% gana más de $94.540
1.3 Moda:
Es
un estadígrafo que puede definirse como el valor más frecuente o el valor de
la variable que presenta la mayor frecuencia
absoluta.
- Datos no tabulados: se busca el valor más repetido
Ej. 3,
5, 5, 5, 3, 4, 7 Mo = 5
6, 3, 3, 6, 5, 8, 4 Mo = 3 y 6
Donde:

1 = diferencia entre fi y fi-1

Ej. Tabla 2
Mo = 90 + 10 · 11
– 7
(11 – 7) + (11 – 8)
Mo = 90 + 10· (0,57)
Mo = 95,71 ($95.710
valor más repetido)
Características de la media, mediana y la moda.
Hemos
aprendido que la media es una medida de tendencia central en la que la suma de las desviaciones respecto
a ella es cero; que la mediana es la medida de tendencia central que divide el área de un histograma o el área bajo la curva de distribución en 2 partes
iguales de manera
que el número de observaciones por debajo de la mediana es igual al número de observaciones por encima de ella, y que
la moda es el valor que presenta la mayor frecuencia.
Nos
referiremos a algunas de sus características y las relaciones mas importantes
que hay entre ellas:
De
las 3 medidas de tendencia central, la media aritmética es muy sensible a los valores
extremos, en tanto que la mediana y la moda no son afectadas por los valores
de los extremos. Por ejemplo,
en la serie 3, 5, 7, 7, 8 la media aritmética es igual a 6; si cambiamos el valor extremo 8 por 18 se tiene la serie 3, 5, 7, 7, 18 cuya
media aritmética es igual a 8 es decir la media varió de 6 a 8.
La mediana
por ser insensible a los valores extremos
no cambia en ninguna de las 2 series manteniendo su valor 7. La moda en ambas series es 7 por ser el valor
más frecuente.
Debido a la gran sensibilidad de la media aritmética a lo valores extremos, a veces resulta
que su valor produce efectos
engañosos. Por ejemplo,
si se esta estudiando el ingreso de un grupo de personas
que tiene los siguientes valores
como sueldos en miles de pesos: 320, 400, 400, 400, 450, 500, 550, 2000,
2900.
Media = 880
Mediana = 450
Moda = 400
Obsérvese que solo 2 tienen ingresos
altos y las 7 restantes
tienen ingresos menores o iguales a 550 o sea que en este caso la media resulto
atípica. La mediana y la moda resultan más
representativas para esta distribución. El conocimiento de las 3 medidas da una buena apreciación de la distribución de los valores
pero si se debe hacer una apreciación con una sola de las medidas es mejor
usar la medina.
Para ilustrar
estas diferencias se han diseñado los siguientes gráficos.
La
media aritmética es un punto de equilibrio (semejante a un centro de gravedad).
La mediana
tiene la propiedad
de que su ordenada divide
el área bajo la curva en dos partes iguales.
La moda es la abscisa correspondiente a la mayor ordenada o pico de la curva.
1.4
Cuartiles y deciles:
En forma similar a la mediana, pueden definirse otros
estadígrafos, llamados cuartiles o deciles, que cumplen con la condición de superar a no más de cierto porcentaje
de los datos y de ser superado, a los más por porcentaje complementario de las observaciones.
-
Datos
no tabulados:



Q1 Q2 Q3
Si separamos los datos en 4 grandes
grupos, cada uno será un cuartil. Q1 = 3 + 5 = 4
Q2 = 7 + 8 = 7.5
2 2
Q3 = 9
Q2 = 7 + 8 = 7.5
2 2
Q3 = 9
La interpretación, por ejemplo del Q1 es: el valor 4 supera el 25% de los datos y es superado
por el 75% de las observaciones restantes (ordenadas de mayor a menor).
-
Datos tabulados: se usa la misma
fórmula que se ocupó en
la mediana, con una pequeña modificación.
Dónde: i = es el n° del cuartil deseado Ej. Tabla 2: calcular el Q1.
Primero calculamos i ·
n = 1· 40 = 10
4 4
Buscamos en la columna
Ni el
valor que supere
el 10, en este caso es el 3er intervalo (en ese intervalo se busca el
cuartil 1)
La
media aritmética es un punto de equilibrio (semejante a un centro de gravedad).
La mediana
tiene la propiedad
de que su ordenada divide
el área bajo la curva en dos partes iguales.
La moda es la abscisa correspondiente a la mayor ordenada o pico de la curva.
Ej. Tabla 2: calcular el
Q1.
Primero calculamos i · n = 1· 40 = 10
4 4
Buscamos en la columna
Ni el
valor que supere
el 10, en este caso es el 3er intervalo (en ese intervalo se busca el
cuartil 1)

7
Q1 = 80 + 10 · (0,28)
Q1 = 82,85
El 25% de las personas de la muestra
gana menos de $82.850 y el 75% superior gana más de $82.850 (ordenados 2 sueldos
de >a<)
Usando el mismo ejemplo, calculamos el decil 8.
Calculamos en primer lugar 8 · n = 8 · 40 = 32
10 10
y se busca en la columna
Ni el
valor que supere 32. En este caso el 5° intervalo sirve.
D8 = 100 + 10 · 32 - 26
8
D8 = 100 + 10 · (0,75) = 107,5
La interpretación es: el 80% de las personas ganan menos de $107.500 y el 20% restante
gana más de $107.500.
Rango intercuartil.
Al estudiar
el rango, vimos que era muy influenciable por
los valores extremos;
para eliminar la influencia de los extremos en estadística se suele analizar
la situación del intermedio de la distribución y a esto se refiere
el rengo intercuartil que es la diferencia entre el
tercer cuartil Q3 y el primero Q1.
Rango intercuartil = Q = Q3 – Q1
Rango
semi-intercuartílico o desviación cuartil. Es la mitad del rango intercuartílico;
designándolo por QD se tiene:
A pesar de que el rango intercuaritl y la desviación
cuartil, como medidas
de la variabilidad de las observaciones son más adecuadas
que el rango, presentan varios inconvenientes que demeritan su
uso. Así:
1. No toma en consideración todos los valores
de la distribución y puede ocurrir que los valores inferiores a Q1 o
superiores a Q2 estén muy compactos o muy dispersos, y el valor de Q sería el mismo.
2. No es posible, conociendo solo Q, hacer
la ubicación precisa
de una observación dentro de la distribución.
3. Al igual
que la mediana, que es el segundo
cuartil, no tiene propiedades que les
permitan intervenir en las relaciones matemáticas que utiliza la estadística.
Ejercicios
1. El precio de 100 artículos es Bs.185,
7 en
promedio, los artículos
se dividen en dos grupos
de precios promedios
Bs.175, 8 y Bs.197, 8.
¿Cuántos artículos hay en cada grupo?
2.
Dada la siguiente tabla.
Salario diario
(miles Bs.)
|
N° de obreros
|
0 – 3,0
|
10
|
3,0 – 4,0
|
16
|
4,0 – 5,0
|
35
|
5,0 – 6,0
|
26
|
6,0 – 7,0
|
13
|
a) ¿Cuál es el salario
máximo que ganan diariamente el 30% de obreros con sueldos
más bajos?
b) ¿Qué % de obreros ganan
más de $5.500?
3. En una población hay 350 individuos con valores en la primera
decil ¿cuántos individuos de la población entre
percentil 18 y la percentil 45?
4. Se prueban
2 tratamientos A y B para controlar
un virus que ataca la hoja del tabaco.
La hoja pierde valor comercial mientras mayor sea el número de lesiones por hoja producida
por el virus. La medición
del número de lesiones por
hoja dio la siguiente tabla de frecuencia:
N° de lesiones /hoja
|
Frecuencia A
|
Frecuencia
B
|
0
|
90
|
130
|
1
|
60
|
100
|
2
|
40
|
50
|
3
|
60
|
20
|
4
|
20
|
40
|
5
|
10
|
60
|
Total
|
280
|
400
|
a) ¿Cuál tratamiento es
mejor para obtener más hojas con 0 lesiones?
b) Calcule medidas
estadísticas que le permitan comprar
en la mejor forma la efectividad
de ambos tratamientos y coméntelas.
c) Construya un gráfico,
que compare adecuadamente la efectividad de los
tratamientos A y B.
5. La siguiente tabla
muestra los tiempos de reacción (en seg.) de 250 perros sometidos a
anestésico inyectado:
Tiempo reacción (seg.)
|
Frecuencia
|
[120 – 170)
|
20
|
[170 - 220)
|
35
|
[220 – 270)
|
85
|
[270 – 320)
|
50
|
[320 – 370)
|
30
|
[370- 420)
|
20
|
[420- 470)
|
10
|
Total
|
250
|
a) Calcule las medidas estadísticas que representen mejor
esta información e interprételas.
b) ¿A los cuántos seg.
reaccionara el 15% de los perros más sensibles
al anestésicos?
c) ¿Cuántos de los 250
perros reaccionaran después de 5 minutos?
6. Un grupo de 200 personas viaja en 2 aviones, el primero de ellos lleva a 150 personas.
El peso promedio de las 200 personas es de 72,5 Kg. Los del segundo
avión pesan en promedio 3,8 Kg. menos que los del primer
avión. ¿Cuál es el peso promedio
de los pasajeros de cada uno de los aviones?
7. La renta
semanal media de los trabajadores de una fábrica
es de Bs.80.000, siendo Bs.95.000
para los administrativos y de Bs.70.000
para los obreros. Calcule el porcentaje
de administrativos y de obreros que tiene la fábrica, si en total
suman 120.
8. La tabla siguiente
representa la distribución de frecuencias
de las vidas medias de 400 ampolletas probadas en la
empresa XXX.
Vida Media
(horas)
|
No ampolletas
|
300 – 399
|
14
|
400 – 499
|
46
|
500 – 599
|
58
|
600 – 699
|
76
|
700 – 799
|
68
|
800 – 899
|
62
|
900 – 999
|
48
|
1000 – 1099
|
22
|
1100 – 1199
|
6
|
Determinar:
a) Límite inferior de la
quinta clase.
b) Marca de clase de la
tercera clase.
c) La frecuencia de la
cuarta clase.
d) Porcentaje de ampolletas cuya vida media es de al menos 500
horas, pero menos de 1000 horas.
e) Número de ampolletas
cuya vida media es superior a 600 horas. Construir:
f) Tabla de frecuencia.
g) Histograma, Polígono de
frecuencias y ojiva de porcentajes.
h) ¿Sobre cuantas horas se
encuentra el 35% de ampolletas de mayor duración?
i)
Calcule media y mediana.
j) Si la vida media se incrementa en 24%, calcular
los nuevos promedios y desviación típica.
9. Los gastos de publicidad son un componente significativo en el costo de los bienes que se venden. La lista de abajo es una distribución de frecuencia que muestra
los gastos en publicidad de 60 empresas de manufacturas.
Gastos
en publicidad en
millones
de Bs
|
Nº de empresas
|
25 – 35
|
6
|
35 – 45
|
10
|
45 – 55
|
21
|
55 – 65
|
16
|
65 – 75
|
8
|
a) Si las empresas que gastaron menos de 45 millones de pesos aumentan
sus gastos en 13%, ¿cómo se
altera el promedio de gastos en publicidad?
b) ¿Qué porcentaje de
empresas gastas más de 58 millones de pesos
en publicidad?
10. La siguiente
información representa la distribución de los gastos en alimentación que realizaron un conjunto de familias de Santiago durante
el año 2001.
Gastos en miles
de pesos
|
Nº de familias
|
150 – 250
|
15
|
250 – 350
|
27
|
350 – 450
|
32
|
450 – 550
|
21
|
550 – 650
|
10
|
a) Para el presente año se espera que tal gasto se incremente en un 8%, más un gasto fijo por cada familia de 25 mil pesos. ¿Cómo varia el promedio del gasto en alimentación de las familias estudiadas en el año 2002 con respecto al año 2001?
b) A las familias que gastaron durante
el año 2001 menos de 270 mil pesos se les dará en bono de 45 mil pesos a cada una y a las restantes se les dará un bono de 28 mil pesos a cada una. ¿Cuál es
el nuevo promedio?.
c) Se sabe que la relación de los ingresos
de este grupo familiar y los gastos en alimentación durante el año 2001 estuvo
dada por:
I = 1.5 G +75
d) ¿Cuál es el gasto en
alimentación que divide la muestra en partes
iguales?
e) ¿Qué porcentaje de
familias que gastaron menos de 300 mil pesos?
11. En un análisis de las llamadas telefónicas que salían a diario de una oficina, se determinó que 64 llamadas tenían un promedio de 2,3 minutos; 47 llamadas de entre 3 a 10 minutos, promediaron 6,1 minutos y 4 llamadas de más de 10 minutos demoraron en promedio 20,6 minutos. ¿cuál es el promedio d la duración de estas llamadas?
12. En un año de biología hay 20 alumnos
de 1er año, 18 de 2º año y 12 de 3er año. Los promedios de notas en los
alumnos de 1er y
2º son 68 y 75 respectivamente. ¿Cuál es el promedio de
los alumnos de 3eraño,
si el promedio de toda la clase fue de 74,84 puntos?
13. La siguiente tabla corresponde al monto de compras realizadas por la cartera
de cliente de una empresa en el 2001.
Ventas x (miles
Bs)
|
Nº de clientes
|
1,0 – 2,5
|
14
|
2,5 – 4,0
|
18
|
4,0 – 5,5
|
22
|
5,5 – 7,0
|
33
|
7,0 – 8,5
|
24
|
8,5 – 10,0
|
9
|
a) Suponiendo que
las compras del
año 2002 están
dadas por la función y = 1,2x + 30. Calcular el promedio
y varianza para el año 2002.
b) ¿Qué porcentaje de
clientes compro más de 7,5 (miles de Bs.) el año 2001?
c) ¿Cuál es el monto máximo del 25% de los clientes
que compraron menos el
año 2002?
Y el desarrollo?
ResponderEliminar