Detectar outliers mediante la distribución normal | Diccionario Economico

Definición de Detectar outliers mediante la distribución normal | Diccionario Economico

Este título se refiere a la técnica de usar la distribución normal para identificar valores atípicos en un conjunto de datos.

En otras palabras, detectar valores atípicos usando la distribución normal consiste en encontrar valores que se consideren extremos para el conjunto de datos usando la fórmula de distribución normal estándar.

  • Valores extremos llamado emisiones en Inglés.
  • Valores interior llamado iniciados en Inglés.

La detección visual de valores atípicos puede ser una opción cuando tiene muy pocos datos. Cuando se trabaja con bases de datos, es muy poco práctico encontrar valores atípicos manualmente. Para solucionar este problema, podemos calcular qué valores se consideran extremos comparándolos con el umbral de rechazo.

En el caso de una distribución normal, un valor se considera extremo si difiere de la media en 3 desviaciones estándar. Como la distribución normal tiene 2 colas, debemos tener en cuenta que puede desviarse tanto negativa como positivamente.

Fórmula para la detección de valores atípicos mediante distribución normal

detectar valores atípicos

Un conjunto de observaciones se puede expresar de la forma anterior, donde x es la media alrededor de la cual fluctúan los valores, y sigma es la varianza de las fluctuaciones de los valores especificados. En otras palabras, sigma es la distancia de las observaciones desde la media.

El factor multiplicativo determina si es un valor atípico o interno. Si z toma los valores 3 o -3, entonces, de acuerdo con la distribución normal, la observación y será un valor atípico.

Para saber el precio GRAMO Usamos la ecuación anterior:

Aislar Z de la ecuación

  • Si z >= 3 o z =< -3, entonces de la distribución normal podemos decir que Y es un valor extremo o atípico.
  • Si z < 3 u oz < -3, entonces de la distribución normal podemos decir que Y es un valor intrínseco o insider.

estándar normal

¿Te suena familiar la ecuación anterior?

Más precisamente, es una expresión de observación que sigue una distribución normal después de haber sido estandarizada o tipificada. Se llama así porque cuando se divide por la desviación estándar o típica, la diferencia en el numerador se expresa en términos de desviaciones.

Por esta razón, podemos asociar valores de desviación con GRAMO y así poder comprarlo con un umbral de 3 desviaciones.

Ejemplo

Encuentre los valores extremos de las siguientes observaciones según la distribución normal:

Ejemplo

Echemos un vistazo a la gráfica:

Artes graficas

Desde el principio, ya podemos ver que el valor que está más alejado del resto es muy probable que sea un valor atípico.

Primero calculamos la media y la desviación estándar:

x = valor medio = 5,8

sigma = desviación estándar = 10,51

Luego sustituimos los valores en la fórmula y calculamos el valor GRAMO para cada observación:

Ejemplo

Los valores anteriores son coeficientes sigma multiplicativos, es decir GRAMO. Cualquier valor superior a 3 o inferior a -3 será un valor extremo.

Solución

Vemos que el valor GRAMO que excede 3 desviaciones estándar es consistente con la observación 49.

Por tanto, el valor extremo o abrupto del conjunto de datos sería 49.

¿Problemas o dudas? Te ayudamos

Si quieres estar al día, suscríbete a nuestra newsletter y síguenos en Instagram. Si quieres recibir soporte para cualquier duda o problema, no dude en ponerse en contacto con nosotros en info@wikieconomia.org

Comentarios

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *