Cómo interpretar los coeficientes de regresión logística

Interpretación de coeficientes de regresión logística

Calculando los efectos marginales medios de los coeficientes de regresión logística

Imagen de Dominika Roseclay en Pexels.com

¿Te encanta la regresión logística, pero odias interpretar cualquier cosa con alguna forma de transformación logarítmica? Bueno, no puedo decir que estés en buena compañía, pero puedo decir que me tienes a mí como compañía.

En este artículo, voy a hablar sobre la interpretación de los coeficientes de regresión logística. Aquí está el esquema:

  1. Interpretación de los coeficientes de regresión lineal
  2. Por qué la interpretación de los coeficientes de regresión logística es desafiante
  3. Cómo interpretar los coeficientes de regresión logística
  4. Cálculo de los efectos marginales medios con el paquete statsmodels
  5. Conclusión

Interpretación de los coeficientes de regresión lineal

La mayoría de las personas con conocimientos elementales de estadística comprenden completamente cómo se interpretan los coeficientes en la regresión lineal. Si ese es tu caso, puedes considerar saltar a la parte del artículo donde se discuten los coeficientes de regresión logística.

La interpretación de los coeficientes de regresión lineal es muy simple y fácil. La simplicidad de la interpretación es una de las razones por las que la regresión lineal sigue siendo una herramienta muy popular a pesar del advenimiento de algoritmos mucho más sofisticados.

La regresión lineal simple (regresión lineal con una variable de entrada) tiene esta forma:

Principalmente estamos interesados en interpretar B₁. Para la regresión lineal, esta interpretación es simple: ante un cambio de una unidad en x, esperamos un cambio de B₁ en y. Otra frase para esta relación es el ‘efecto marginal medio’.

Veamos un ejemplo de cómo podemos interpretar B₁ utilizando simulación. La simulación es una excelente herramienta para probar herramientas/enfoques de ciencia de datos porque creamos la verdad base y luego vemos si nuestros métodos pueden identificarla.

En el código a continuación, estamos simulando 30,000 filas de valores x. Simulamos los valores x tomando muestras de una distribución normal con los parámetros que elijamos (en este caso, una media de 2 y una desviación estándar de 0.2). Luego simulamos y multiplicando x por nuestro impacto simulado de 0.16 y luego agregamos un error aleatorio…

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Ciencia de Datos

Los modelos de lenguaje grandes tienen sesgos. ¿Puede la lógica ayudar a salvarlos?

Investigadores del MIT entrenaron modelos de lenguaje conscientes de la lógica para reducir estereotipos dañinos como...

Inteligencia Artificial

La IA puede detectar los primeros signos de un tsunami a partir de las ondas de choque atmosféricas

Los investigadores descubrieron que los modelos de inteligencia artificial (IA) disponibles en el mercado pueden dete...

Inteligencia Artificial

Utilice un modelo de base de IA generativa para la síntesis y respuesta a preguntas utilizando sus propios datos

Los modelos de lenguaje grandes (LLMs) se pueden utilizar para analizar documentos complejos y proporcionar resúmenes...

Ciencia de Datos

Gestionando los costos de almacenamiento en la nube de aplicaciones de Big Data

Con la creciente dependencia de cantidades cada vez mayores de datos, las empresas de hoy en día dependen más que nun...

Inteligencia Artificial

AI diseña un nuevo robot desde cero en segundos

Un equipo de investigación liderado por científicos de la Universidad Northwestern creó una inteligencia artificial c...

Inteligencia Artificial

Los estados están pidiendo más clases de ciencias de la computación. Ahora necesitan maestros

Code.org informó que para el 2022, cada estado de Estados Unidos tenía una ley o política que promovía la educación e...