Medidas de centro

 

Objetivos de aprendizaje

·         Encontrar la media, la mediana, y la moda de un conjunto de números.

·         Encontrar el rango y el rango medio de un conjunto de datos.

·         Leer e interpretar datos de un diagrama de caja y bigote.

·         Resolver problemas de aplicación que requieren los cálculos de la media, la mediana, el rango, o el rango medio.

 

Introducción

 

La media, la mediana, y moda son herramientas importantes para un estadístico. Estas medidas de centro utilizan puntos de datos para aproximar y entender un “valor medio” o “promedio” de un conjunto de datos. Otras dos medidas de interés son el rango y el rango medio, que usan los valores máximo y mínimo de un conjunto de datos para describir la extensión de los datos.

 

Entonces ¿para qué necesitarías encontrar la mitad de un conjunto de datos? Y ¿por qué necesitas tres medidas en lugar de sólo una? Veamos detenidamente las tres medidas de centro para entender cómo nos pueden ayudar a entender conjuntos de datos.

 

Media, mediana, y moda

 

La “media” es un término matemático para el “promedio” que probablemente ya conoces. También se le conoce como “media aritmética,” se calcula sumando todos los valores del conjunto de datos y dividiendo la suma entre el número de datos.

 

Normalmente puedes calcular con la mente el promedio de dos números familiares, como 10 y 16, si muchos cálculos. ¿Qué número se encuentra entre ellos? el 13. Una forma matemática de resolver esto, es sumar 10 y 15 (que nos da 26) y luego dividir entre 2 (porque hay 2 números en el conjunto de datos). 26 ÷ 2 = 13

 

Conocer el proceso es útil cuando necesitamos encontrar la media de dos o más números. Por ejemplo, si te piden encontrar la media de los números 2, 5, 3, 4, 5, y 5, primero encuentras la suma: 2 + 5 + 3 + 4 + 5 + 5 = 24. Luego, divides esa suma entre la cantidad de números en el conjunto, que es 6. Entonces la media es 24 ÷ 6, o 4.

 

En el conjunto de datos anterior, notamos que la media fue 4 y que el conjunto también contenía el valor de 4. Esto no ocurre siempre. Observa el ejemplo siguiente. — la media es 18, pero el número 18 no se encuentra en el conjunto de datos.

 

 

Ejemplo

Problema

Encontrar la media del conjunto: 4, 7, 28, 33.

 

4 + 7 + 28 + 33 = 72

Sumar todos los valores.

 

Dividir entre 4, el número de valores.

Respuesta

La media es 18.

 

 

 

Ahora, veamos lo que es la “mediana.” La mediana es el valor medio cuando los datos están ordenados. Si hubiera dos valores medios, la mediana es el promedio de esos dos valores.

 

Para calcular la mediana, primero debemos poner los datos en orden numérico de chico a grande. Para identificar el valor medio.

 

Por ejemplo, veamos los siguientes valores: 4, 5, 1, 3, 2, 7, 6. Para encontrar la mediana del conjunto, debes ordenar de chico a grande.

 

1  2   3  4  5  6  7

 

Luego identifica el valor medio. Hay tres valores a la derecha del 4 y tres valores a la izquierda. El valor medio es 4, entonces 4 es la mediana.

 

Si hay un número par de elementos, la mediana será la media de los dos elementos centrales.

 

 

Ejemplo

Problema

Encontrar la mediana del conjunto:

2, 5, 3, 4, 5, 5.

 

2, 3, 4, 5, 5, 5

Ordena los valores de chico a grande.

 

2, 3, 4, 5, 5, 5

 

 

 

 

El conjunto tiene 2 valores medios. Entonces encuentras la media (promedio) de los dos valores.

 

 

Respuesta

La mediana es 4.5.

 

 

 

Finalmente, consideramos la “moda.” La moda se encuentra buscando el valor que aparece con más frecuencia. Si hay un empate, usamos ambos valores como las modas. Algunas veces no hay moda. Esto sucede cuando no hay un valor que ocurre más frecuentemente que otros. En nuestro conjunto de datos (2, 3, 4, 5, 5, 5), el número 5 aparece 3 veces y todos los demás números sólo una vez, entonces la moda es 5.

 

 

Ejemplo

Problema

Encontrar la moda del conjunto:

12, 4, 12, 5, 5, 8, 12, 0, 1, 12.

 

0, 1, 4, 5, 5, 8, 12, 12, 12, 12

Ordenar los valores de chico a grande (aunque este paso no es necesario, a veces ayuda tener los números en orden ascendiente).

 

0, 1, 4, 5, 5, 8, 12, 12, 12, 12

Encuentra el valor que más ocurre.

Respuesta

La moda es 12.

 

 

 

Veamos un ejemplo con datos relevantes.

 

 

Ejemplo

Problema

Carlos recibió las siguientes calificaciones de sus exámenes de matemáticas: 84, 92, 74, 98, y 82. Encuentra la media, la mediana, y la moda de sus calificaciones.

 

Para encontrar la media, suma todas las calificaciones y luego divides el resultado entre el número de exámenes.

 

 

La media es 86.

 

74, 82, 84, 92, 98

Para encontrar la media, ordena las calificaciones de chico a grande.

 

84

Hay cinco calificaciones, entonces la calificación del centro es la tercera en la lista ordenada. Esta es la mediana.

 

74, 82, 84, 92, 98

Como cada número aparece exactamente una vez, no hay moda.

Respuesta

La media es 86.

La mediana es 84.

No hay moda.

 

 

 

¿Qué podemos aprender de la media, la mediana, y la moda de las calificaciones de Carlos? Nota que los valores no son el mismo.

 

La media y la mediana nos dan una idea de cómo le está yendo a Carlos. Observa las mediciones, nota que la mitad de los datos está en los 80s: la media es 86, y la mediana es 84. De eso se trata cuando usas la media o la mediana — encontrar el centro, o la mitad de los datos. Nota también, que no hay moda, porque Carlos no sacó lo mismo en dos de los exámenes. En el caso de las calificaciones, la moda normalmente no es importante — a menos que haya muchos 0s, ¡lo que significa que el estudiante no hace su tarea, o que no tiene idea de lo que sucede!

 

 

Ejemplo

Problema

Encontrar la media, la mediana, y la moda del siguiente conjunto de números:

12, 11, 13, 11, 12, 10, 10, 11, 13, 14.

 

Para encontrar la media, suma todos los números y divide el resultado entre la cantidad de números.

 

10, 10, 11, 11, 11, 12, 12, 13, 13, 14

Para encontrar la mediana, primero orden a los números de chico a grande.

 

Como hay 10 números (un número par) la mediana es la media de los dos números centrales (el 5to y el 6to), o el valor entre 11 y 12.

 

10, 10, 11, 11, 11, 12, 12, 13, 13, 14

Para encontrar la moda, busca el número que aparece más frecuentemente.

 

11

El número 11 aparece con más frecuencia, 3 veces.

Respuesta

La media es 11.7.

La mediana es 11.5.

La moda es 11.

 

 

 

En este caso, la media, la mediana, y la moda son un valor muy similar. Esto muestra alguna consistencia en los datos, con un promedio alrededor de 11. Si estos datos representan edades de estudiantes en un equipo de ajedrez, por ejemplo, tendrías una buena idea de que todos los integrantes tienen unos 11 años de edad, con algunos miembros más grandes o más chicos.

 

 

Durante un periodo de 7 días en Julio, un meteorólogo registró que la mediana diaria de la temperatura máxima fue de 91º.

 

¿Cuál de los siguientes enunciados es verdadero?

 

i)                    La temperatura máxima fue de exactamente 91º en cada uno de los siete días.

ii)                   La temperatura máxima nunca bajó de los 92º.

iii)                 La mitad de las temperaturas máximas estuvieron por encima de los 91º y la otra mitad debajo de los 91º.

 

A) Sólo i

B) Sólo ii

C) Sólo iii

D) i, ii, y iii

 

Mostrar/Ocultar Respuesta

A) Sólo i

Incorrecto. Sólo porque la mediana fue de 91º no significa que la temperatura alcanzó 91º en cada día. La respuesta correcta es sólo iii.

 

B) Sólo ii

Incorrecto. Sabemos que la mediana es 91º, entonces 91º es un miembro del conjunto de datos — lo que significa que la temperatura debió ser menor que 92º por lo menos en un momento del día. La respuesta correcta es sólo iii.

 

C) Sólo iii

Correcto. La mitad de las temperaturas altas estuvieron por encima de los 91º y la otra mitad por debajo de los 91º .

 

D) i, ii, y iii

Incorrecto. El enunciado i es incorrecto porque una mediana máxima de 91º no necesariamente significa que la temperatura alcanzó los 91º cada día, y ii es incorrecta porque sabes que la mediana es 91º, entonces 91º es un número en el conjunto de datos — lo que significa que la temperatura debió ser menor que 92º por lo menos en un momento del día. La respuesta correcta es sólo iii.

 

 

 

Rango y rango medio

 

Existen otras medidas útiles además de la media, la mediana, y la moda que nos ayudan a analizar un conjunto de datos. Cuando vemos los datos, a veces queremos entender cómo se extienden: el espacio entre el número mayor y el número menor. Este es el rango de los datos. Para encontrar el rango, restamos el valor mínimo del conjunto de datos del valor máximo. Por ejemplo, en los datos de 2, 5, 3, 4, 5, y 5, el valor mínimo es 2 y el valor máximo es 5, entonces el rango es 5 – 2, o 3.

 

También es útil saber qué número está a la mitad entre el valor mínimo y el valor máximo del conjunto de datos. Este número se llama rango medio. Para encontrar el rango medio, sumamos los dos valores mínimo y máximo y luego dividimos entre dos, en otras palabras, encontramos la media de los valores mínimo y máximo.

 

El rango medio de 2, 5, 3, 4, 5, y 5 es .

 

Veamos un par de ejemplos.

 

 

Ejemplo

Problema

Encontrar el rango y el rango medio del siguiente conjunto de números: 2, 4, 7, 10, 14, 35.

 

rango: 35 – 2 = 33

Resta el valor mínimo del valor máximo para encontrar el rango.

 

rango medio:

Suma el valor mínimo mas el valor máximo y divide entre 2.

Respuesta

El rango es 33.

El rango medio es 18.5.

 

 

 

Ejemplo

Problema

Encontrar el rango y el rango medio del siguiente conjunto de números: 62, 88, 20, 145, 37, 105, 93, 22.

 

valor mínimo: 20

valor máximo: 145

Como los datos no están ordenados de menor a mayor, identifica los valores mínimo y máximo.

 

rango: 145 – 20 = 125

Resta el valor mínimo del valor máximo para encontrar el rango.

 

rango medio:

Suma el valor mínimo mas el valor máximo y divide entre 2.

Respuesta

El rango es 125.

El rango medio es 82.5.

 

 

 

Diagrama de caja y bigote

 

Otro tipo de gráfica con la que puedes encontrarte es el diagrama de caja y bigote. Estas gráficas proveen una manera visual de entender el rango y el rango medio de un conjunto de datos.

 

Aquí hay un conjunto de ejemplo de 15 números para empezar.

 

12, 5, 18, 20, 11, 9, 3, 5, 7, 18, 12, 15, 6, 10, 11

 

Crear un diagrama de caja y bigote a partir de estos datos requiere encontrar la mediana del conjunto. Para hacer esto, ordenamos los datos.

 

3, 5, 5, 6, 7, 9, 10, 11, 11, 12, 12, 15, 18, 18, 20

 

El conjunto de datos tiene 15 números, por lo que la mediana será el octavo número en el conjunto: 11.

 

Encontrar la median del conjunto de datos es esencialmente dividirlos en dos — un conjunto de números debajo de la mediana, y un conjunto de números por encima de la mediana. ¡Un diagrama de caja y bigote requiere que encuentres también la mediana de esos números!

 

Conjunto de abajo: 3, 5, 5, 6, 7, 9, 10. Mediana: 6

Conjunto de arriba: 11, 12, 12, 15, 18, 18, 20. Mediana: 15

 

Entonces, la mediana del conjunto es 11, la mediana del conjunto de abajo es 6, y la mediana del conjunto de arriba es 15.

 

3, 5, 5, 6, 7, 9, 10, 11, 11, 12, 12, 15, 18, 18, 20

 

Un diagrama de caja y bigote para este conjunto de datos se muestra a continuación. ¿Puedes ver las similitudes entre los números de arriba y la forma de la caja?

 

 

Observa que una “caja” (sección rectangular) empiezan 6 (la mediana del conjunto bajo) y va hasta 11 (la mediana de todo el conjunto), y la otra caja va desde 11 a 15 (la mediana del conjunto alto).

 

Los “bigotes” son los segmentos de recta en cada extremo. Uno va desde 3 (el último valor del conjunto) al 6, y el otro va desde el 15 al 20 (el máximo valor del conjunto).

 

El diagrama de caja y bigote esencialmente divide el conjunto de datos en cuatro secciones (o cuartiles): bigote, caja, caja, bigote. El tamaño de los cuartiles puede ser distinto, pero el número de puntos de datos en cada cuartil es el mismo.

 

Puedes usar el diagrama de caja y bigote para analizar cómo los datos están distribuidos. También puedes comparar dos conjuntos de datos.

 

Usando medidas de centro para resolver problemas

 

Usar la media, la mediana, y la moda, así como el rango y el rango medio te puede ayudar a analizar situaciones y tomar decisiones sobre cosas como buscar qué es mejor, si caminar o tomar el autobús a la escuela, o incluso si comprar o vender acciones en la bolsa.

 

Veamos un ejemplo de cómo el análisis de datos usando medidas de centro puede ayudarte a tomar decisiones (¡Y a que llegues a la escuela a tiempo!).

 

 

Ejemplo

Problema

A continuación se muestra una tabla con el tiempo que le tomó a Marta llegar a la escuela tomando el autobús o caminando, en 12 días. Los tiempos de puerta a puerta, significan que el reloj inicia cuando sale de la puerta de su casa y termina cuando entra a la escuela.

 

Autobús

Caminando

16 min

22 min

14 min

19 min

15 min

21 min

14 min

20 min

31 min

21 min

15 min

20 min

 

·         ¿Qué método de transporte es más rápido?

·         Si sale de su casa 25 minutos antes de la hora de entrada a la escuela, ¿debe caminar o tomar el autobús para llegar a tiempo?

Determinar la media de cada método de transporte.

autobús:  31 –14 = 17

caminando:  22 – 19 = 3

Determinar el rango de cada método de transporte.

autobús:  14, 14, 15, 15, 16, 31

caminando: 19, 20, 20, 21, 21, 22

 

Determinar la mediana de cada método de transporte.

autobús:  14, 15

caminando:  20, 21

Determinar la moda de cada método de transporte.

 

 

Autobús

Caminando

Media

17.5

20.5

Mediana

15

20.5

Moda

14, 15

20, 21

Rango

17

3

Respuesta

Observando la media, la mediana, y la moda, la manera más rápida de llegar a la escuela es tomando el autobús. Los datos también muestran que el autobús es más variable, con un rango de 17, entonces si Marta quiere estar segura de llegar a la escuela a tiempo, debe caminar.

 

En el ejemplo anterior, tomar el autobús es, en promedio, más rápido que caminar. Esto lo revela la media de cada método, la cual muestra que el autobús es 3 minutos más rápido. La moda y la mediana muestran una ventaja aún más grande de tomar el autobús, y esto se debe a la vez que tardó 31 minutos que en realidad no se toma en cuenta en estas medidas. Observa la diferencia en la media (17.5) y la mediana (15) de tomar el autobús, lo que te dice que hay variación en los datos.

 

Cuando se trata de llegar a la escuela a tiempo, aunque no sea el método más rápido, caminar es más confiable, con valores consistentes de media, mediana, y moda, y un valor bajo de rango, lo que significa que la distribución de los datos es poca.

 

Veamos otro ejemplo.

 

 

Ejemplo

Problema

Los 3 mejores jugadores de tenis durante Julio de los años 2007-2011 fueron (en ningún orden en particular), Roger Federer, Rafael Nadal, y Novak Djokovic. Basados en su clasificación en Julio, ¿quién ha tenido el mejor desempeño en este lapso de tiempo?

 

Clasificación de la ATP para Julio, 2007-2011

Julio

Nadal

Federer

Djokovic

2011

2

3

1

2010

1

3

2

2009

2

1

4

2008

2

1

3

2007

2

1

3

Datos tomados de ATP WorldTour, Agosto 2011

 

Encuentra la media de la clasificación de cada jugador.

 

Nadal: 1, 2, 2, 2, 2 = 2

Federer: 1, 1, 1, 3, 3 = 1

Djokovic: 1, 2, 3, 3, 4 = 3

Encuentra la mediana de la clasificación de cada jugador.

 

Nadal: 1, 2, 2, 2, 2 = 2

Federer: 1, 1, 1, 3, 3 = 1

Djokovic: 1, 2, 3, 3, 4 = 3

Encuentra la moda de la clasificación de cada jugador.

 

Nadal: 2 – 1  = 1

Federer: 3 – 1 = 2

Djokovic: 4 – 1 = 3

Encuentra el rango de la clasificación de cada jugador.

Respuesta

Aparentemente, Nadal y Federer están virtualmente empatados como el mejor tenista en los últimos 5 años, con Djokovic en tercer lugar. La media de los rendimientos de Nadal y Federer es 1.8, por lo que están empatados en eso. Y a pesar de que la clasificación de Federer tiene una mediana de 1 y una moda de 1 (ganándole en ambas a Nadal,), también tiene un rango más amplio — Federer ha estado en el tercer lugar durante más tiempo, y Nadal no.

 

 

Dependiendo de tu punto de vista (¡y preferencia de jugador!), podrías argumentar que ya sea Federer o Nadal es mejor que el otro, pero los datos parecen mostrar que son casi iguales. Claramente, conforme pasa el tiempo, los desempeños de Nadal y de Federer se acercan mucho, con una media de clasificación idéntica. La media probablemente de la mejor evaluación de desempeño en general, pero no nos dice toda la historia. Usando el rango, Nadal ha sido más consistente que Federer, aunque tiene menos números en su clasificación. No se muestra en ninguna de estas mediciones cómo la clasificación de Djokovic se ha movido hacia arriba y la clasificación de Federer hacia abajo. También vale la pena mencionar que es difícil llegar a una conclusión con tan pocos datos; el uso de otras mediciones, como campeonatos ganados y el promedio de clasificación de oponentes puede ayudar a saber quién es fue el mejor jugador durante este tiempo.

 

Sumario

 

Las medidas de centro te ayudan a analizar datos numéricos. La media (o media aritmética) normalmente llamada “promedio”, se calcula dividiendo la suma de los elementos de los datos entre el número de elementos. La mediana es el número que está a la mitad cuando los datos se ordenan de mínimo a máximo, y la moda es el número que aparece más frecuentemente. El rango es la diferencia entre el número mínimo y el número máximo, y el rango medio es la media del número mínimo y el número máximo. Los diagramas de caja y bigote usan la media y el rango para ayudarte a interpretar visualmente los datos.