Trabajar con un conjunto muy grande de datos impide manejarlos de manera eficiente, por lo que se hace necesario representarlos mediante una distribución de frecuencias que es la agrupación de estos datos, generalmente representada en una tabla, en categorías excluyentes que muestran el número de veces que tales datos se repiten, es decir, su frecuencia de aparición en el conjunto. En ocasiones la cantidad de categorías también es muy grande -más de 10 ya es complicado de representar y manejar- por lo que se hace necesario trabajar la información de una manera aún más simplificada dividiendo el espectro de valores posibles en intervalos, llamados clases que luego se registran en una tabla conocida como distribución de frecuencias agrupadas. Así, en vez de usar cada uno de los valores individuales como categorías, se trabaja con rangos de valores, usando una distribución más compacta, que permitirá que los comportamientos y tendencias puedan visualizarse mejor.

Fuente: Pixabay
Aquí estudiaremos el comportamiento central o representativo de un conjunto de datos que ha sido agrupado de esta manera. Partiremos de un ejemplo concreto: la siguiente es la tabla de estaturas de 40 estudiantes de la UNAM, entonces el tamaño de la colección es $n=40$
1.51
1.63
1.72
1.85
1.61
1.63
1.73
1.85
1.61
1.64
1.74
1.86
1.60
1.64
1.75
1.86
1.60
1.65
1.75
1.87
1.59
1.66
1.77
1.88
1.56
1.66
1.78
1.88
1.55
1.69
1.80
1.90
1.54
1.71
1.83
1.92
1.52
1.72
1.83
1.99