Valores atípicos y el rango — medir la dispersión

Valores atípicos y el rango — medir la dispersión

Valores atípicos y el rango

Un valor atípico (o outlier) es un valor mucho mayor o mucho menor que el resto de los datos. Puede arrastrar la media muy arriba o muy abajo — pero la mediana y la moda apenas se mueven.

El rango — una medida sencilla de la dispersión

El rango es simplemente la diferencia entre el valor máximo y el mínimo.

Rango = máx − mín.

Ejemplo. Puntuaciones 5, 6, 7, 8, 9 → rango = 9 − 5 = 4. Dispersión pequeña. Ejemplo. Puntuaciones 5, 6, 7, 8, 95 → rango = 95 − 5 = 90. El 95 es un valor atípico que dispara el rango.

Cómo afectan los valores atípicos a la media

La media es sensible — un único valor extremo puede desplazarla mucho.

Ejemplo. Cinco donativos: 1 €, 2 €, 3 €, 4 €, 100 €.
  • Media = (1 + 2 + 3 + 4 + 100) ÷ 5 = 22 €.
  • Mediana = 3 €.

La media de 22 € no describe realmente un donativo "típico" en este grupo. La mediana de 3 € sí.

Cómo afectan los valores atípicos al rango

El rango también es sensible — solo utiliza los dos valores extremos, así que cualquier valor atípico lo agranda directamente.

Detectar valores atípicos

Mira los datos ordenados de menor a mayor. Cualquier valor que esté muy lejos del grupo de los demás es candidato a valor atípico.

  • 10, 11, 12, 13, 45 → 45 es un valor atípico.
  • 10, 11, 12, 13, 14 → no hay valores atípicos.

Qué hacer con un valor atípico

  • Compruébalo. ¿Es un error de medida? (Entonces a menudo se descarta.)
  • Consérvalo pero usa la mediana, que resiste bien los valores atípicos.
  • Menciónalo. Cuando expongas los resultados, di "sin contar un valor atípico de 45…".

Pruébalo