Definicion de Definición, fórmula y ejemplo de regresión lineal múltiple (MLR)
Definición, fórmula y ejemplo de regresión lineal múltiple (MLR)
¿Qué es la regresión lineal múltiple (MLR)?
La regresión lineal múltiple (MLR), también conocida como regresión múltiple, es un método estadístico que utiliza múltiples variables independientes para predecir el resultado de una variable de respuesta. El propósito de la regresión lineal múltiple es modelar la relación lineal entre variables explicativas (independientes) y variables de respuesta (dependientes). Esencialmente, la regresión múltiple es una extensión de la regresión de mínimos cuadrados ordinarios (MCO) en el sentido de que involucra más de una variable explicativa.
Resultados clave
- La regresión lineal múltiple (MLR), también conocida como regresión múltiple, es un método estadístico que utiliza múltiples variables independientes para predecir el resultado de una variable de respuesta.
- La regresión múltiple es una extensión de la regresión lineal (OLS) que utiliza solo una variable independiente.
- MLR se utiliza ampliamente en econometría e inferencia financiera.
Fórmula y cálculo de regresión lineal múltiple.
th
I
«=»
b
0
+
b
1
X
I
1
+
b
2
X
I
2
+
.
.
.
+
b
PAG
X
I
PAG
+
ϵ
Dónde,
Para
I
«=»
norte
observaciones:
th
I
«=»
variable dependiente
X
I
«=»
variables explicativas
b
0
«=»
Intercepción y (término constante)
b
PAG
«=»
coeficientes de pendiente para cada variable explicativa
ϵ
«=»
término de error del modelo (también conocido como residuos)
\begin{aligned}&y_i = \beta_0 + \beta _1 x_{i1} + \beta _2 x_{i2} + … + \beta _p x_{ip} + \epsilon\\&\textbf{donde, para } i = n \textbf{ observaciones:}\\&y_i=\text{variable dependiente}\\&x_i=\text{variables independientes}\\&\beta_0=\text{intersección y (término constante)}\\&\ beta_p =\text{coeficientes de pendiente para cada variable explicativa}\\&\epsilon=\text{término de error del modelo (también conocido como residuos)}\end{aligned} thI«=»b0+b1XI1+b2XI2+...+bPAGXIPAG+ϵdonde, por I«=»norte observaciones:thI«=»variable dependienteXI«=»variables explicativasb0«=»Intercepción y (término constante)bPAG«=»coeficientes de pendiente para cada variable explicativaϵ«=»término de error del modelo (también conocido como residuos)
Lo que la regresión lineal múltiple puede decirle
La regresión lineal simple es una función que permite a un analista o estadístico hacer predicciones sobre una variable basándose en la información conocida sobre otra variable. La regresión lineal sólo se puede utilizar cuando hay dos variables continuas: una variable independiente y una variable dependiente. Una variable independiente es un parámetro que se utiliza para calcular la variable dependiente o el resultado. El modelo de regresión múltiple se extiende a varias variables explicativas.
El modelo de regresión múltiple se basa en los siguientes supuestos:
- Existe una relación lineal entre variables dependientes y variables independientes.
- Las variables independientes no están altamente correlacionadas entre sí.
- thI Las observaciones se seleccionan de forma independiente y aleatoria de la población.
- Los residuos deben distribuirse normalmente con una media de 0 y una varianza. PAG
El coeficiente de determinación (R-cuadrado) es una estadística que se utiliza para medir qué parte de la varianza de un resultado puede explicarse por la variación de las variables independientes. R2 siempre aumenta a medida que se agregan más predictores al modelo MLR, aunque los predictores puedan no estar relacionados con la variable de resultado.
R2 Por lo tanto, no puede utilizarse por sí solo para determinar qué predictores deben incluirse en el modelo y cuáles deben excluirse. R2 solo puede estar entre 0 y 1, donde 0 indica que el resultado no puede predecirse mediante ninguna de las variables independientes y 1 indica que el resultado puede predecirse sin error en función de las variables independientes.
Al interpretar los resultados de regresión múltiple, los coeficientes beta son válidos mientras se mantienen constantes todas las demás variables (“todo lo demás es igual”). Los resultados de regresión múltiple se pueden mostrar horizontalmente como una ecuación o verticalmente como una tabla.
Ejemplo de regresión lineal múltiple
Por ejemplo, un analista podría querer saber cómo los movimientos del mercado afectan el precio de ExxonMobil (XOM). En este caso, su ecuación lineal tendría el valor del índice S&P 500 como variable independiente o predictor y el precio XOM como variable dependiente.
En realidad, muchos factores predicen el resultado de un evento. Por ejemplo, los movimientos de precios de ExxonMobil no sólo dependen del desempeño del mercado en su conjunto. Otros factores, como el precio del petróleo, las tasas de interés y los movimientos en los precios de los futuros del petróleo, pueden afectar el precio de Exon Mobil (XOM) y los precios de las acciones de otras compañías petroleras. Para comprender una relación en la que están presentes más de dos variables, se utiliza la regresión lineal múltiple.
La regresión lineal múltiple (MLR) se utiliza para determinar la relación matemática entre múltiples variables aleatorias. En otras palabras, MLR examina cómo se relacionan múltiples variables independientes con una única variable dependiente. Una vez que se ha identificado cada uno de los factores independientes para predecir la variable dependiente, se puede utilizar información sobre varias variables para crear una predicción precisa del nivel de influencia que tienen en la variable de resultado. El modelo crea una relación de línea recta (lineal) que se aproxima mejor a todos los puntos de datos individuales.
Refiriéndose a la ecuación MLR anterior, en nuestro ejemplo:
- thI = variable dependiente – precio XOM
- Xi1 = tasas de interés
- Xi2 = precio del petróleo
- Xi3 = valor del índice S&P 500
- Xi4= precio de futuros del petróleo
- B0 = intersección con el eje y en el tiempo cero
- B1 = coeficiente de regresión que mide el cambio unitario en la variable dependiente cuando xi1 cambios: el precio de XOM cambia cuando cambian las tasas de interés
- B2 = valor del coeficiente que mide el cambio unitario en la variable dependiente cuando xi2 Cambios: el precio de XOM cambia cuando cambian los precios del petróleo.
Estimaciones de mínimos cuadrados – B0B1B2…BPAG— generalmente se calcula utilizando software estadístico. Puede incluir la misma cantidad de variables en un modelo de regresión, en el que cada variable independiente se diferencia por un número: 1,2, 3, 4…p. Un modelo de regresión múltiple permite al analista predecir un resultado basándose en la información proporcionada sobre múltiples variables explicativas.
Sin embargo, el modelo no siempre es completamente exacto porque cada punto de datos puede diferir ligeramente del resultado predicho por el modelo. El valor residual E, que es la diferencia entre los resultados reales y los previstos, se incluye en el modelo para tener en cuenta cambios tan pequeños.
Suponiendo que ejecutamos nuestro modelo de regresión de precios XOM utilizando un software de computación estadística, que arroja el siguiente resultado:
El analista interpreta este resultado en el sentido de que si las demás variables permanecen constantes, el precio del XOM aumentará un 7,8% si el precio del petróleo en los mercados aumenta un 1%. El modelo también muestra que el precio de XOM disminuirá un 1,5% después de un aumento del 1% en las tasas de interés. R2 indica que el 86,5% de las fluctuaciones del precio de las acciones de Exxon Mobil pueden explicarse por cambios en la tasa de interés, el precio del petróleo, los futuros del petróleo y el índice S&P 500.
Diferencia entre regresión lineal y múltiple
La regresión de cuadrados lineales ordinarios (MCO) compara la respuesta de una variable dependiente dados cambios en alguna variable explicativa. Sin embargo, la variable dependiente rara vez se explica por una sola variable. En este caso, el analista utiliza la regresión múltiple, que intenta explicar la variable dependiente utilizando más de una variable independiente. Las regresiones múltiples pueden ser lineales o no lineales.
Las regresiones múltiples se basan en el supuesto de que existe una relación lineal entre las variables dependientes e independientes. También supone que no existe una correlación significativa entre las variables independientes.
¿Qué hace que la regresión múltiple sea múltiple?
La regresión múltiple considera el efecto de más de una variable explicativa sobre cualquier resultado de interés. Evalúa la influencia relativa de estas variables explicativas o independientes sobre la variable dependiente mientras mantiene constantes todas las demás variables del modelo.
¿Por qué es mejor utilizar la regresión múltiple en lugar de la regresión OLS simple?
La variable dependiente rara vez se explica por una sola variable. En tales casos, el analista utiliza la regresión múltiple, que intenta explicar la variable dependiente utilizando más de una variable independiente. Sin embargo, el modelo supone que no existen correlaciones significativas entre las variables independientes.
¿Puedo hacer una regresión múltiple manualmente?
Esto es poco probable porque los modelos de regresión múltiple son complejos y se vuelven aún más complejos a medida que se incluyen más variables en el modelo o a medida que crece la cantidad de datos a analizar. Para ejecutar una regresión múltiple, probablemente necesitará utilizar software estadístico especializado o funciones en programas como Excel.
¿Qué significa que la regresión múltiple es lineal?
En la regresión lineal múltiple, el modelo calcula una línea de mejor ajuste que minimiza la varianza de cada una de las variables incluidas con respecto a la variable dependiente. Como se ajusta a una recta, es un modelo lineal. También existen modelos de regresión no lineal que incluyen múltiples variables, como la regresión logística, la regresión cuadrática y los modelos probit.
¿Cómo se utilizan los modelos de regresión múltiple en finanzas?
Cualquier modelo econométrico que tenga en cuenta más de una variable puede ser múltiple. Los modelos factoriales comparan dos o más factores para analizar las relaciones entre las variables y el desempeño resultante. El modo de tres factores de Fama y French es un modelo que amplía el modelo de valoración de activos de capital (CAPM) añadiendo factores de riesgo de tamaño y valor al factor de riesgo de mercado en el CAPM (que es en sí mismo un modelo de regresión). Al incluir estos dos factores adicionales, el modelo corrige esta tendencia a tener un desempeño superior, lo que se cree que lo convierte en una mejor herramienta para evaluar el desempeño gerencial.
Preguntas Frecuentes
Incluye tres preguntas frecuentes sobre el contenido dando sus respuestas. Utiliza muchas negritas utilizando HTML tag ¿Qué es la regresión lineal múltiple (MLR)? La regresión lineal múltiple (MLR), también conocida como regresión múltiple, es un método estadístico que utiliza múltiples variables independientes para predecir el resultado de una variable de respuesta. El propósito de la regresión lineal múltiple es modelar la relación lineal entre variables explicativas (independientes) y variables de respuesta (dependientes). Esencialmente, la regresión múltiple es una extensión de la regresión de mínimos cuadrados ordinarios (MCO) en el sentido de que involucra más de una variable explicativa. Resultados clave La regresión lineal múltiple (MLR), también conocida como regresión múltiple, es un método estadístico que utiliza múltiples variables independientes para predecir el resultado de una variable de respuesta.La regresión múltiple es una extensión de la regresión lineal (OLS) que utiliza solo una variable independiente.MLR se utiliza ampliamente en econometría e inferencia financiera. Fórmula y cálculo de regresión lineal múltiple. th I «=» b 0 + b 1 X I 1 + b 2 X I 2 + . . . + b PAG X I PAG + ϵ Dónde, Para I «=» norte observaciones: th I «=» variable dependiente X I «=» variables explicativas b 0 «=» Intercepción y (término constante) b PAG «=» coeficientes de pendiente para cada variable explicativa ϵ «=» término de error del modelo (también conocido como residuos) \begin{aligned}&y_i = \beta_0 + \beta _1 x_{i1} + \beta _2 x_{i2} + … + \beta _p x_{ip} + \epsilon\\&\textbf{donde, para } i = n \textbf{ observaciones:}\\&y_i=\text{variable dependiente}\\&x_i=\text{variables independientes}\\&\beta_0=\text{intersección y (término constante)}\\&\ beta_p =\text{coeficientes de pendiente para cada variable explicativa}\\&\epsilon=\text{término de error del modelo (también conocido como residuos)}\end{aligned} thI»=»b0+b1XI1+b2XI2+…+bPAGXIPAG+ϵdonde, por I»=»norte observaciones:thI»=»variable dependienteXI»=»variables explicativasb0»=»Intercepción y (término constante)bPAG»=»coeficientes de pendiente para cada variable explicativaϵ»=»término de error del modelo (también conocido como residuos) Lo que la regresión lineal múltiple puede decirle La regresión lineal simple es una función que permite a un analista o estadístico hacer predicciones sobre una variable basándose en la información conocida sobre otra variable. La regresión lineal sólo se puede utilizar cuando hay dos variables continuas: una variable independiente y una variable dependiente. Una variable independiente es un parámetro que se utiliza para calcular la variable dependiente o el resultado. El modelo de regresión múltiple se extiende a varias variables explicativas. El modelo de regresión múltiple se basa en los siguientes supuestos: Existe una relación lineal entre variables dependientes y variables independientes. Las variables independientes no están altamente correlacionadas entre sí. thI Las observaciones se seleccionan de forma independiente y aleatoria de la población. Los residuos deben distribuirse normalmente con una media de 0 y una varianza. PAG El coeficiente de determinación (R-cuadrado) es una estadística que se utiliza para medir qué parte de la varianza de un resultado puede explicarse por la variación de las variables independientes. R2 siempre aumenta a medida que se agregan más predictores al modelo MLR, aunque los predictores puedan no estar relacionados con la variable de resultado. R2 Por lo tanto, no puede utilizarse por sí solo para determinar qué predictores deben incluirse en el modelo y cuáles deben excluirse. R2 solo puede estar entre 0 y 1, donde 0 indica que el resultado no puede predecirse mediante ninguna de las variables independientes y 1 indica que el resultado puede predecirse sin error en función de las variables independientes. Al interpretar los resultados de regresión múltiple, los coeficientes beta son válidos mientras se mantienen constantes todas las demás variables (“todo lo demás es igual”). Los resultados de regresión múltiple se pueden mostrar horizontalmente como una ecuación o verticalmente como una tabla. Ejemplo de regresión lineal múltiple Por ejemplo, un analista podría querer saber cómo los movimientos del mercado afectan el precio de ExxonMobil (XOM). En este caso, su ecuación lineal tendría el valor del índice S&P 500 como variable independiente o predictor y el precio XOM como variable dependiente. En realidad, muchos factores predicen el resultado de un evento. Por ejemplo, los movimientos de precios de ExxonMobil no sólo dependen del desempeño del mercado en su conjunto. Otros factores, como el precio del petróleo, las tasas de interés y los movimientos en los precios de los futuros del petróleo, pueden afectar el precio de Exon Mobil (XOM) y los precios de las acciones de otras compañías petroleras. Para comprender una relación en la que están presentes más de dos variables, se utiliza la regresión lineal múltiple. La regresión lineal múltiple (MLR) se utiliza para determinar la relación matemática entre múltiples variables aleatorias. En otras palabras, MLR examina cómo se relacionan múltiples variables independientes con una única variable dependiente. Una vez que se ha identificado cada uno de los factores independientes para predecir la variable dependiente, se puede utilizar información sobre varias variables para crear una predicción precisa del nivel de influencia que tienen en la variable de resultado. El modelo crea una relación de línea recta (lineal) que se aproxima mejor a todos los puntos de datos individuales. Refiriéndose a la ecuación MLR anterior, en nuestro ejemplo: thI = variable dependiente – precio XOM Xi1 = tasas de interés Xi2 = precio del petróleo Xi3 = valor del índice S&P 500 Xi4= precio de futuros del petróleo B0 = intersección con el eje y en el tiempo cero B1 = coeficiente de regresión que mide el cambio unitario en la variable dependiente cuando xi1 cambios: el precio de XOM cambia cuando cambian las tasas de interés B2 = valor del coeficiente que mide el cambio unitario en la variable dependiente cuando xi2 Cambios: el precio de XOM cambia cuando cambian los precios del petróleo. Estimaciones de mínimos cuadrados – B0B1B2…BPAG— generalmente se calcula utilizando software estadístico. Puede incluir la misma cantidad de variables en un modelo de regresión, en el que cada variable independiente se diferencia por un número: 1,2, 3, 4…p. Un modelo de regresión múltiple permite al analista predecir un resultado basándose en la información proporcionada sobre múltiples variables explicativas. Sin embargo, el modelo no siempre es completamente exacto porque cada punto de datos puede diferir ligeramente del resultado predicho por el modelo. El valor residual E, que es la diferencia entre los resultados reales y los previstos, se incluye en el modelo para tener en cuenta cambios tan pequeños. Suponiendo que ejecutamos nuestro modelo de regresión de precios XOM utilizando un software de computación estadística, que arroja el siguiente resultado: Imagen de Sabrina Jiang © Wikieconomia 2020 El analista interpreta este resultado en el sentido de que si las demás variables permanecen constantes, el precio del XOM aumentará un 7,8% si el precio del petróleo en los mercados aumenta un 1%. El modelo también muestra que el precio de XOM disminuirá un 1,5% después de un aumento del 1% en las tasas de interés. R2 indica que el 86,5% de las fluctuaciones del precio de las acciones de Exxon Mobil pueden explicarse por cambios en la tasa de interés, el precio del petróleo, los futuros del petróleo y el índice S&P 500. Diferencia entre regresión lineal y múltiple La regresión de cuadrados lineales ordinarios (MCO) compara la respuesta de una variable dependiente dados cambios en alguna variable explicativa. Sin embargo, la variable dependiente rara vez se explica por una sola variable. En este caso, el analista utiliza la regresión múltiple, que intenta explicar la variable dependiente utilizando más de una variable independiente. Las regresiones múltiples pueden ser lineales o no lineales. Las regresiones múltiples se basan en el supuesto de que existe una relación lineal entre las variables dependientes e independientes. También supone que no existe una correlación significativa entre las variables independientes. ¿Qué hace que la regresión múltiple sea múltiple? La regresión múltiple considera el efecto de más de una variable explicativa sobre cualquier resultado de interés. Evalúa la influencia relativa de estas variables explicativas o independientes sobre la variable dependiente mientras mantiene constantes todas las demás variables del modelo. ¿Por qué es mejor utilizar la regresión múltiple en lugar de la regresión OLS simple? La variable dependiente rara vez se explica por una sola variable. En tales casos, el analista utiliza la regresión múltiple, que intenta explicar la variable dependiente utilizando más de una variable independiente. Sin embargo, el modelo supone que no existen correlaciones significativas entre las variables independientes. ¿Puedo hacer una regresión múltiple manualmente? Esto es poco probable porque los modelos de regresión múltiple son complejos y se vuelven aún más complejos a…
¿Problemas o dudas? Te ayudamos
Si quieres estar al día, suscríbete a nuestra newsletter y síguenos en Instagram. Si quieres recibir soporte para cualquier duda o problema, no dude en ponerse en contacto con nosotros en info@wikieconomia.org.