1. El documento describe los conceptos de frecuencias absolutas, relativas y acumuladas y cómo se utilizan para construir tablas de distribución de frecuencias para variables discretas, continuas y no mensurables. 2. Incluye las fórmulas y pasos para construir tablas de distribución de frecuencias para variables continuas, como determinar el número de intervalos y la amplitud de los intervalos. 3. Proporciona un ejemplo numérico para ilustrar cómo aplicar los pasos.
1. La representación de los datos:
FRECUENCIAS.
Cuando se reúne gran cantidad de datos primarios es útil distribuirlos en clases y
categorías y determinar las frecuencias de las clases, o sea, el número de
elementos que pertenecen a una clase. El ordenamiento tabular de los datos por
clases conjuntamente con las frecuencias de clases se denomina distribución de
frecuencias
El caso que se describe a continuación, variables discretas se
denomina distribución por conteo de valores individuales. Supongamos que un
determinado colectivo, representado por la variable estadística Xi, que para
mayor sencillez consideraremos como unidimensional; sean los datos de esta
variable (representativo cada uno de ellos de un suceso) X1, X2,… ,
Xn (supuesto que sean n los valores de la variable considerada.)
Definiremos como frecuencia de un dato el número de veces que este aparece
en el colectivo; consecuentemente, si una variable estadística toma r valores,
cada uno de los cuales puede repetirse un cierto número de veces, podríamos
decir que el número de datos representado por la variable serían N, siendo N la
suma de las respectivas frecuencias de cada dato (N=ΣXi).
Este valor N será denominado como frecuencia total, mientras que la
frecuencia de cada dato recibirá el nombre de frecuencia absoluta o
simplemente frecuencia (fi). La frecuencia absoluta nos habla del número de
veces que un dato aparece en un colectivo, más ello no nos dice demasiado en
orden al establecimiento de comparaciones sobre la importancia de este dato.
Para obtener una idea de la importancia que un dato posee en el seno de un
colectivo, puesto que no es suficiente concepto de frecuencia, se utiliza el
concepto frecuencia relativa, que se definirá como: el coeficiente entre la
frecuencia absoluta del dato considerado y la frecuencia total (fr=fi/ΣXi).
Para efectos prácticos, asumiremos las siguientes definiciones de frecuencias:
Frecuencias absolutas: es el número de veces que aparece en
la muestra dicho valor de la variable y se representa por fi.
Frecuencias relativas: es el cociente entre la frecuencia absoluta y el tamaño
de la muestra. La denotaremos por fri.
Frecuencias absoluta acumulada: para poder calcular este tipo de
frecuencias hay que tener en cuenta que la variable estadística ha de ser
cuantitativa o cualitativa ordenable. En otro caso no tiene mucho sentido
el cálculo de esta frecuencia. La frecuencia absoluta acumulada de un valor
de la variable, es el número de veces que ha aparecido en la muestra un
valor menor o igual que el de la variable y lo representaremos por fa, se
puede acumular, en la tabla estadística) en orden ascendente (fa↑) o
descendente (fa↓).
Frecuencia relativa acumulada: al igual que en el caso anterior se calcula
como el cociente entre la frecuencia absoluta acumulada dividido por el
tamaño de la muestra (N) y la denotaremos por fra.
Análisis de la Información.
Mtra. Janet Ríos Alvarado.
Distribución de Frecuencias.
2. Resumiendo lo expuesto, si Xi es un valor de la variable, podemos representar
por fi a su frecuencia y por fi/ΣXi a su frecuencia relativa (siendo ΣXi=N o la
frecuencia total). Para el conjunto de los valores de la variable Xi tendríamos,
así la tabla #1, compresiva de la información sobre dicha variable, a través de
las respectivas frecuencias:
Tabla #1: Variables Discretas
Valores de la variable Xi frecuencias absolutas frecuencias relativas
(datos) fi fi/N
X1 f1 f1/N
X2 f2 f2/N
… … …
… … …
Xn fn fn/N
Donde: N=Σfi y Σfi/N=1
Otro es el caso de las clases representadas en forma de intervalos, variables
continuas, llamados intervalos de clases que poseen extremos llamados limite
inferior y limite superior, un intervalo se dice que es abierto o no cerrado, por un
extremo si no contiene el límite correspondiente.
La longitud, tamaño o amplitud de un intervalo de clases (C) es la diferencia
entre los limites superior e inferior (C=lim sup – lim inf). El Recorrido (R) es la
diferencia entre el dato mayor y el menor del conjunto da datos en estudio
(R=Xn – X1).
En el caso de variables continuas será necesario fijar intervalos de frecuencias
para llegar a un resumen efectivo de la información original. A menudo es
necesario representar una clase, o más particularmente, un intervalo por un
único valor, este representará a todo el intervalo y se denominará marca de
clases.
Matemáticamente el punto medio de cada intervalo corresponde a lo que
denominamos marca de clase, se denotará por Xi, y constituirá el valor
representativo de cada intervalo. El número de observaciones que
correspondan a cada intervalo se denominará frecuencias absolutas.
Análisis de la Información.
Mtra. Janet Ríos Alvarado.
Distribución de Frecuencias.
3. Tabla #2: Variables Continuas
Intervalos Marcas de Clases Frecuencias Absolutas
(C) Xi fi
X1-X2 X1 f1
X2-X3 X2 f2
… … …
… … …
Xn-1-Xn Xn fn
Donde
N = Σfi = Número de observaciones
C = X’ – X" = Amplitud del intervalo
Por último, en el caso de variables no mensurables, dicha tabla adoptará una
forma como la siguiente:
Tabla #3: Variable Ordinales
Variable Frecuencias
Característica A fA
Característica B fB
… …
Análisis de la Información.
Mtra. Janet Ríos Alvarado.
Distribución de Frecuencias.
4. … …
Característica Z fZ
1. Reglas Generales para construir las distribuciones de frecuencias por
intervalos
A = ( X1, X2, … , Xn )
2. Efectuar el arreglo ordenado (Ascendente o Descendente) de la población
o muestra.
3. Obtener la frecuencia absoluta mediante la tabulación o conteo de los
datos (homogenizar los datos)
R = (valor mayor – valor menor) = Xn – X1
4. Encontrar el rango o recorrido (R) de los datos:
5. Encontrar el número de clases o intervalos de clases (K). El número de
clases debe ser tal que se evite el detalle innecesario, pero que no
conduzca a la perdida de más información de la que puede ser
convenientemente ignorada. Para este cálculo se utiliza la formula de
Sturges
K = 1 + 3.322(log. N)
5- Determinar la amplitud de la clase ( C ):
R
C = --------
K
Nota: el resultado siempre se aproxima al siguiente entero si excede al número
entero obtenido, no importa el monto de la fracción excedida al entero
˜ C = se lee "se aproxima a…"
6. El dato menor (X1) será el limite inferior de la primera clase. A él se le
suma C y se obtiene el límite superior de la primera clase que también
será el límite inferior de la segunda clase. Luego se suma nuevamente C y
se obtiene el límite superior del segundo intervalo e inferior del tercero. Y
así sucesivamente hasta que el limite superior corresponda o supere
ligeramente el valor mayor ( Xn ), la cantidad de clases obtenidas deberá
corresponder con el número K calculado mediante la formula de Sturges.
7. Una vez construidos los intervalos se calculan, mediante tabulación de
acuerdo a los límites inferiores y superiores de las clases, las frecuencias
absolutas, relativas, porcentuales y acumuladas correspondientes.
Análisis de la Información.
Mtra. Janet Ríos Alvarado.
Distribución de Frecuencias.
5. 8. Con los datos obtenidos se procede a construir la tabla de distribución de
frecuencia.
Tabla de distribución de frecuencias.
Una de los primeros pasos que se realizan en cualquier estudio estadístico es
la tabulación de resultados, es decir, recoger la información de la muestra
resumida en una tabla, que denominaremos distribución de frecuencias, en la
que cada valor de la variable se le asocian determinados números que
representan el número de veces que ha aparecido, su proporción con respecto
a otros valores de la variable, etc.
Por tanto, llamaremos distribución de frecuencias a un agrupamiento de datos
en clases acompañada de sus frecuencias: frecuencias absolutas, frecuencias
relativa o frecuencia porcentuales. En caso de que las variables estén al menos
en escala ordinal aparecen opcionalmente las frecuencias acumuladas
absolutas, y frecuencias acumuladas porcentuales. Las distribuciones de
frecuencias varían en dependencia si corresponden a una variable discreta o a
una variable continua.
Ejemplo #1: Variable Continua:
La tienda “XYZ S.A” estaba interesada en efectuar un análisis de
sus cuentas por comprar. Uno de los factores que más interesaba a
la administración de la tienda era el de los saldos de las cuentas de crédito. Se
escogió al azar una muestra aleatoria de 30 cuentas y se anotó el saldo de
cada cuenta (en unidades monetarias) como sigue:
77.97 13.02 17.97 89.19 12.18 8.15 34.40 43.13 79.61 90.99
43.66 29.75 7.42 93.91 20.64 21.10 17.64 81.59 60.94 43.97
32.67 43.66 51.69 53.40 68.13 11.10 12.98 38.74 70.15 25.68
Solución:
1. A= ( 7.42, 8.15, …, …, …, 90.99, 93.91 )
donde: X1 = valor mínimo = 7.42
Xn= valor máximo = 93.91
2. Efectuar el arreglo ordenado de la población o muestra:
R = valor mayor – valor menor = Xn – X1 = 93.91 – 7.42 = 86.49
3. Encontrar el rengo o recorrido de los datos: "R"
K=1+3.322(log N)
Nota: en el ejemplo en estudio N=30 por cuanto que son 30 clientes en la
muestra:
K = 1 + 3.322 (log 30)
= 1 + 3.322 (1.477) el log fue obtenido según calculadora
Análisis de la Información.
Mtra. Janet Ríos Alvarado.
Distribución de Frecuencias.
6. = 1+ 4.9069
= 5.9069 ~6 aproximado al siguiente entero
4. Encontrar en número de clases "K" , según la fórmula de Sturges:
5. Determinar la amplitud de la clase: "C"
Nota: obsérvese que se va a trabajar con una cifra significativa más cómoda, o
sea como los datos están dados en centésimos, se calculo C hasta el milésimo
para evitar que algún dato coincida con el límite de clases
Clases P.M. fi fr fa↓ fa↑ fra↓ fra↑
Xi
7.420 – 21.835 14.628 10 0.33 10 30 0.33 1.00
21.835 – 36.250 29.043 4 0.13 14 20 0.46 0.67
36.250 – 50.665 43.458 5 0.17 19 16 0.63 0.54
50.665 – 65.080 57.873 3 0.10 22 11 0.73 0.37
65.080 – 79.495 72.288 3 0.10 25 8 0.83 0.27
79.495 – 93.910 86.703 5 0.17 30 5 1.00 0.17
Total XXX 30 1.00 XXX XXX XXX XXX
Simbología utilizada:
XI = Punto medio o marca de clases
fi = frecuencia absoluta
fr = frecuencia relativa
fa↓ = frecuencia absoluta acumulada descendente
fa↑ = frecuencia absoluta acumulada ascendente
fra↓ = frecuencia relativa acumulada descendente
fra↑ = frecuencia relativa acumulada ascendente
Análisis de la Información.
Mtra. Janet Ríos Alvarado.
Distribución de Frecuencias.
7. Nota: Obsérvese que el límite inferior de la primera clase es el valor mínimo
(X1=7.42 ) y el límite superior es el resultado de X1+C = 7.42+14.415 = 21.835.
El límite inferior de la siguiente clase es igual al límite superior de la clase
anterior y el límite superior es el resultado de adicionarle nuevamente la
amplitud de la clase (C).
Obsérvese que el límite superior de la última clase es igual al valor mayor (
Xn=93.91 )
Representaciones Gráficas de la Distribución de Frecuencias
a. Los Cuadros estadísticos:
La estadística es una disciplina que nos enseña a organizar los datos recogidos
para poder analizar sus características y posteriormente inferir, a partir de las
muestras tomadas, las características de la población investigada. Los cuadros
o tablas corresponden a arreglos sistemáticos de los datos por filas y columnas
y son un buen complemento del texto en los informes
El primer procedimiento estadístico consiste en tabular los datos según el tipo
de escala de medición utilizada. La tabulación de los datos conlleva a
representar la información a través de tablas que de forma general contiene las
siguientes partes fundamentales:
1. Numeración (siempre que se presenten dos o más cuadros)
2. Título: es la descripción que precede al cuadro, la cuál deberá estar
redactada en forma breve y clara, de tal manera que exprese su
contenido, siguiendo el ordenamiento del mismo. Es necesario abarcar las
características: Qué, Dónde, Cómo y Cuándo
3. Encabezamiento: se refiere al número de atributos o variables que se
quieren representar en el cuadro y se anotan como denominaciones de las
columnas y subcolumnas; puede ser unidimensional, bidimensional o
multidimensional. Los títulos de las columnas van en mayúsculas y los
subtítulos en minúsculas
4. Cuerpo: es el conjunto de columnas y líneas que contiene el cuadro en
orden vertical y horizontal, donde se colocan los datos sobre los hechos
observados
5. Pie: se refiere a la información adicional necesaria a saber: notas,
llamadas, fuentes de información y otras. Se anotan en el espacio debajo
de la línea inferior que limita el cuerpo del cuadro.
a. Los Gráficos Estadísticos:
El gráfico es quizás el auxiliar más valioso y utilizado para expresar datos
estadísticos, este elemento no le añade novedad a las tablas o cuadros
Análisis de la Información.
Mtra. Janet Ríos Alvarado.
Distribución de Frecuencias.
8. estadísticos, es de fácil comprensión y accesible a un número mayor de
usuarios. El gráfico además de expresar visualmente los hechos más
importantes de la información numérica, permite una mejor y más fácil
comprensión y ahorra tiempo y esfuerzo en el análisis de datos estadísticos al
facilitar su apreciación visual en forma conjunta:
-Histogramas de frecuencias:
Un histograma es un gráfico que sirve para representar una distribución de
frecuencias. Este gráfico está formado por un conjunto de rectángulos (caso de
variables continuas) que tienen como base un eje horizontal (generalmente el
eje de las abscisas o de las X), y como centro los puntos medios de las clases.
Los anchos de las clases y las áreas de los rectángulos son proporcionales a
las frecuencias de las clases. En el caso de las variables discretas el gráfico
consiste de un conjunto de barras verticales en lugar de rectángulos,
hallándose cada barra sobre la observación respectiva y con una altura
proporcional a la frecuencia de la observación
- Polígono de frecuencias:
El polígono de frecuencias es un gráfico formado por líneas quebradas, que
tiene los centros de las clases representadas en un eje horizontal (eje de las X)
y las frecuencias de las clases en un eje vertical (eje de las Y). La frecuencia
correspondiente a cada centro de clase se señala mediante un punto y luego
los puntos consecutivos se unen por líneas rectas. Del correspondiente
histograma se puede lograr el polígono de frecuencia uniendo los puntos
medios de las bases superiores de cada rectángulos mediante líneas rectas.
Análisis de la Información.
Mtra. Janet Ríos Alvarado.
Distribución de Frecuencias.
9. -Ojivas:
Las ojivas se refieren a los gráficos que se construyen utilizando una
distribución acumulativa de frecuencias, el orden de acumulación se aplica al
cuadro de distribución de frecuencia y puede ser descendente (fa↓, fra↓) o
ascendente (fa↑, fra↑). La figura que se forma al unir los puntos del polígono de
frecuencias acumulativas es lo contrario del orden anunciado (por ejemplo si se
utilizó el orden descendente en la acumulación de los datos en el cuadro, la
ojiva resulta ser ascendente).
Análisis de la Información.
Mtra. Janet Ríos Alvarado.
Distribución de Frecuencias.
10. ACTIVIDADES:
En grupos de tres estudiantes, equivalen a nota de un parcial)
Problema #1:
Variable Continua
En la siguiente tabla se presentan los pesos de 40 estudiantes de
la Universidad de Panamá, con una aproximación de una libra.
138 164 150 132 144 125 149 157
146 164 140 147 136 148 152 144
168 126 138 176 163 118 154 165
146 173 142 147 135 153 140 135
161 145 135 142 150 156 145 126
Análisis de la Información.
Mtra. Janet Ríos Alvarado.
Distribución de Frecuencias.
11. a. Construya una tabla de distribución de frecuencias, indicando las
frecuencias absolutas, relativas, absolutas acumuladas y relativas
acumuladas.
b. Construya un histograma, un polígono de frecuencias y una ojiva de la
distribución.
Problema #2: Variable Discreta:
Una encuesta entre un grupo de madres-solteras, para analizar
los problemas económicos que enfrentan, en determinada comunidad; arrojó
los siguientes resultados acerca del número de niños en el hogar.
1423535335
1121412141
2112123233
3134113542
2514231251
a. Construya una tabla de distribución de frecuencias y sus respectivas
representaciones gráficas.
Problema #3:
Una agencia de viajes ofrece precios especiales en ciertas travesías por el
Caribe. Planea ofrecer varios de estos paseos durante la próxima temporada
invernal en el hemisferio norte y desea enviar folletos a posibles clientes. A fin
de obtener el mayor provecho por cada unidad monetaria gastada en
publicidad, necesita la distribución de las edades de los pasajeros de travesías
anteriores.
Se consideró que si participaban pocas personas de un grupo de edad en los
paseos no sería económico enviar un gran número de folletos a personas de
ese grupo de edad. La agencia seleccionó una muestra de 40 clientes
anteriores de sus archivos y se registró sus edades, como sigue:
77 18 63 84 38 54 50 59
54 56 36 50 50 34 44 41
58 58 53 62 62 43 52 53
63 62 62 61 61 52 60 60
Análisis de la Información.
Mtra. Janet Ríos Alvarado.
Distribución de Frecuencias.
12. 45 66 83 63 63 58 61 71
a. Organice los datos en una tabla de distribución de frecuencias de las
edades de los clientes en la muestra
b. ¿Cuál grupo de edad presenta la mayor frecuencia relativa? ¿Cuál la
menor frecuencia relativa?
c. Saque conclusiones que puedan ayudar a la agencia a planear una
campaña de publicidad para los paseos invernales.
Análisis de la Información.
Mtra. Janet Ríos Alvarado.
Distribución de Frecuencias.