paint-brush
Mis notas sobre las métricas de error MAE vs MSE 🚀por@sengul
45,094 lecturas
45,094 lecturas

Mis notas sobre las métricas de error MAE vs MSE 🚀

por Sengul Karaderili6m2022/03/11
Read on Terminal Reader
Read this story w/o Javascript

Demasiado Largo; Para Leer

Nos centraremos en las métricas MSE y MAE, que son métricas de evaluación de modelos de uso frecuente en los modelos de regresión. MAE es la distancia promedio entre los datos reales y los datos pronosticados, pero no castiga grandes errores en la predicción. MSE mide la diferencia cuadrática promedio entre los valores estimados y el valor real. La regularización de L1 y L2 es una técnica utilizada para reducir la complejidad del modelo. Lo hace penalizando la función de pérdida al regularizar la función de la función.

Companies Mentioned

Mention Thumbnail
Mention Thumbnail
featured image - Mis notas sobre las métricas de error MAE vs MSE 🚀
Sengul Karaderili HackerNoon profile picture

Esta publicación contiene mis notas sobre las métricas de error.

Contenido:

  • Resumen de regresión lineal
  • MAE
  • MSE
  • Comparar MAE vs MSE
  • Bono: Regularización L1 y L2
  • laboratorio de experimentos
  • ¡Prima! Si queremos comparar MAE y RMSE
  • Fuentes


    Nos centraremos en las métricas MSE y MAE, que son métricas de evaluación de modelos de uso frecuente en los modelos de regresión.


    Resumen de regresión lineal

    En regresión lineal:

    y' es la etiqueta predicha (una salida deseada) b es el sesgo (la intersección y) w1 es el peso de la característicax1 es una característica (una entrada conocida)


    Supuestos de Regresión Lineal 💫

    Distribución normal

    1. Distribución normal de residuos

    Normalidad de los residuos. Los residuos deben estar normalmente distribuidos .

    2. Linealidad de los residuos

    El modelo de regresión es lineal en parámetros. La media de los residuos es cero. Independencia de los residuos

    Hay básicamente 2 clases de dependencias

    Los residuos se correlacionan con otra variable. La multicolinealidad es una forma elegante de decir que sus variables independientes están altamente correlacionadas entre sí.

    Los residuos se correlacionan con otros residuos (cercanos) (autocorrelación). Sin autocorrelación de residuos. Esto es aplicable especialmente para datos de series de tiempo. La autocorrelación es la correlación de una serie temporal con retrasos de sí misma.

    3. Igual varianza de residuos

    La homocedasticidad está presente cuando el ruido de su modelo se puede describir como aleatorio y el mismo en todas las variables independientes. De nuevo, la media de los residuos es cero.

    Error absoluto medio (MAE)

    MAE es el promedio de todos los errores absolutos. La distancia media absoluta entre los datos reales y los datos pronosticados, pero no castiga los grandes errores de predicción.

    Pasos del MAE:

  1. Encuentre todos sus errores absolutos, xi – x.
  2. Súmalos todos.
  3. Divida por el número de errores. Por ejemplo, si tuviste 10 medidas, divide por 10.
  4. Error cuadrático medio (MSE)

    MSE, mide el promedio de los cuadrados de los errores, es decir, la diferencia promedio al cuadrado entre los valores estimados y el valor real.

    Siempre es no negativo, y los valores más cercanos a cero son mejores.

    Pasos de MSE:

    1. Calcule los residuos para cada punto de datos.
    2. Calcular el valor al cuadrado de los residuos.
    3. Calcule el promedio de los residuos del paso 2.
    4. Compararlos

      MAE:

      • La idea detrás del error absoluto es evitar la cancelación mutua de los errores positivos y negativos.
      • Un error absoluto solo tiene valores no negativos.
      • Del mismo modo, evitar la posibilidad de cancelaciones mutuas tiene su precio: no se puede determinar la asimetría (sesgo).
      • El error absoluto conserva las mismas unidades de medida que los datos bajo análisis y otorga a todos los errores individuales el mismo peso (en comparación con el error cuadrático).
      • Esta distancia es fácilmente interpretable y cuando se agrega sobre un conjunto de datos usando la media aritmética tiene un significado de error promedio.
      • El uso del valor absoluto puede presentar dificultades en el cálculo del gradiente de los parámetros del modelo. Esta distancia se utiliza en métricas tan populares como MAE, MdAE, etc.

      MSE:

      • El error cuadrático sigue la misma idea que el error absoluto: evitar valores de error negativos y cancelación mutua de errores.
      • Debido al cuadrado, se enfatizan los errores grandes y tienen un efecto relativamente mayor en el valor de la métrica de rendimiento. Al mismo tiempo, el efecto de errores relativamente pequeños será aún menor. A veces, esta propiedad del error cuadrático se denomina penalizar errores extremos o ser susceptible a valores atípicos. Según la aplicación, esta propiedad puede considerarse positiva o negativa. Por ejemplo, enfatizar errores grandes puede ser una medida de discriminación deseable en la evaluación de modelos.
      • En caso de datos atípicos , MSE será mucho más grande en comparación con MAE. Evitar la posibilidad de cancelaciones mutuas tiene su precio: no se puede determinar la asimetría (sesgo) (para MAE).
      • En MSE, el error aumenta de forma cuadrática mientras que el error aumenta de forma proporcional en MAE.
      • En MSE, dado que el error se eleva al cuadrado, cualquier error de predicción está siendo fuertemente penalizado.

    Referencia: https://arxiv.org/pdf/1809.03006.pdf