Image result for regression model

 

Hace unos días en una plática con buenos amigos científicos de datos, se me ocurrió decir que con los algoritmos actuales la regresión era cosa del pasado, a lo cual uno de los dos expertos me dijo que no necesariamente, cambiamos de tema pero me quedé con la incógnita de si mi amigo tiene la razón o si un servidor.

Después de meditar sobre su comentario, llegué a la conclusión que él tiene razón, aún con los algoritmos actuales la regresión es sumamente útil y me di a la tarea de ponerme a pensar en las veces en que he usado de  una manera más eficiente el modelo de regresión.

La verdad es que el modelo de regresión es muy noble,  y tiene muchos puntos a su favor, mencionaré solo los que considero más importantes:

  1. Casi cualquier programa matemático tiene ese algoritmo (desde Excel hasta el software de tu preferencia).

 

  1. En estudios de corte transversal, con relaciones lineales entre variables es eficiente, y esto es porque el minimizar el error al cuadrado de la estimación sigue siendo un objetivo muy certero.

 

  1. Me atrevería a decir que su poder de interpretación y explicación es mejor que la de cualquier algoritmo matemático.

 

  1. Puedes hacer pruebas de medias equivalentes con variables categóricas

 

  1. Cuando se violan algunos supuestos de la regresión, pueden hacerse modificaciones (eliminar algunos datos, realizar alguna transformación de variables, etc…) que validan el análisis o reducen el efecto de no cumplir al 100% con los supuestos.

 

El tercer punto es el más importante de todos desde mi particular punto de vista; si quieres cuantificar tanto el efecto directo de una variable sobre la dependiente o en cambios lo puedes hacer con facilidad, también puedes ver el efecto que todo el conjunto de variables explicativas tienen sobre el modelo, y si el software en cuestión te da los valores estandarizados, puedes obtener no solo el efecto sino el PESO de cada variable en el modelo.

En cuanto al cuarto punto, probar una característica cualitativa en un modelo es equivalente a realizar una prueba de medias, y de entrada tienes el valor de esa diferencia de ser esta significativa.

Así que si piensas que la  Regresión pasó de moda  como lo llegué a pensar, te invito a que sigas viendo el lado útil de este clásico algoritmo….

Espera la segunda parte de este artículo….

 

El autor es econometrista y científico de datos en el área de bienes de consumo

Ser o No Ser….¿Regresión o No?. Parte I

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *