Outlier – Definición, qué es y concepto | Diccionario Economico

Definición de Outlier – Definición, qué es y concepto | Diccionario Economico

La definición técnica del título «Outlier – Definición, qué es y concepto» es resumida a continuación: Un outlier es un valor atípico o extremo en un conjunto de datos que se desvía significativamente de los demás. Los outliers pueden influenciar negativamente los resultados de un análisis estadístico y deben ser identificados y tratados adecuadamente.

En pocas palabras, un valor atípico es una observación en una muestra o serie de tiempo que es inconsistente con el resto. Imagina, por ejemplo, que estamos midiendo la altura de los alumnos de una clase.

Imagine una muestra de 10 estudiantes. La altura de cada uno es la siguiente:

Muestra 1
Alumnoaltura en metros
11,65
21.80
31.72
41.68
51.75
61.85
71.62
81.79
91.82
101.69

La altura media en la clase será de 1,73. Si tenemos en cuenta la altura máxima (1,85) y la altura mínima (1,62) y la distancia entre ellas a la media, vemos que es igual a 0,113 y 0,117, respectivamente. Como podemos ver, el valor promedio está aproximadamente en la mitad del intervalo y puede considerarse una estimación bastante buena.

efecto de explosión

Ahora pensemos en otra muestra de 10 estudiantes, su crecimiento sería el siguiente:

muestra 2
Alumnoaltura en metros
11,65
21.80
31.72
41.68
52.18
62.20
71.62
81.79
91.75
101.69

En este caso, la altura media de la clase será de 1,81. Si ahora miramos la altura máxima (2,20) y la altura mínima (1,62) y la distancia que las separa de la media, vemos que son 0,39 y 0,18 respectivamente. En este caso, la media ya no está aproximadamente en la mitad del intervalo.

La influencia de las dos observaciones más extremas (2.18 y 2.20) llevó a que la media aritmética se acercara al valor máximo de la distribución.

En este ejemplo, vemos el efecto que tienen los valores atípicos y cómo pueden sesgar el cálculo de la media.

¿Cómo detectar valores atípicos?

Cómo corregir el efecto atípico

En situaciones como esta, donde hay valores atípicos que son significativamente diferentes del resto, la mediana es la mejor estimación para saber qué punto tiene más observaciones.

En el caso de ambas distribuciones, y dado que tenemos un número par de valores, no podemos tomar exactamente el valor que divide a la mitad de la distribución para calcular la mediana. Con lo cual, ordenando los valores de menor a mayor, tomaríamos la quinta y sexta observación (ambas dejando 4 observaciones de cada lado) y calcularíamos la mediana de la siguiente manera:

Muestra 1:

1,75 + 1,72/2 = 1,73

Muestra 2:

1,79 + 1,71/2 = 1,75

Como podemos ver, en la muestra #1, como no hay outliers ni outliers, la mediana es 1.73, que es lo mismo que la media. En cambio, para la muestra 2, el valor medio es 1,75. Como podemos ver, este valor está más alejado de la altura promedio, que fue de 1,81, y nos brinda una estimación puntual de mayor calidad para saber aproximadamente qué punto tiene la mayor cantidad de observaciones.

punto estimado

¿Problemas o dudas? Te ayudamos

Si quieres estar al día, suscríbete a nuestra newsletter y síguenos en Instagram. Si quieres recibir soporte para cualquier duda o problema, no dude en ponerse en contacto con nosotros en info@wikieconomia.org

Comentarios

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *