Conjunto de clasificadores Clasificador de votación

Conjunto de clasificadores de votación

Combina muchos modelos diferentes para una mejor predicción

Fronteras de decisión con clasificador de votación (Imagen del autor: Códigos en referencias)

La palabra “Ensemble” en el contexto de ML se refiere a una colección de un número finito de modelos de ML (puede incluir ANN), entrenados para la misma tarea. Por lo general, los modelos se entrenan de forma independiente y luego se combinan sus predicciones.

Cuando las predicciones de diferentes modelos difieren, a veces es más útil utilizar el conjunto para la clasificación que cualquier clasificador individual. Aquí, nos gustaría combinar diferentes clasificadores y crear un conjunto y luego utilizar el conjunto para la tarea de predicción. ¿Qué se discutirá en esta publicación?

  • Usar VotingClassifier de Sklearn para construir un conjunto.
  • ¿Qué es Hard y Soft Voting en VotingClassifier?
  • Verificar el rendimiento de los modelos individuales con VotingClassifier.
  • Finalmente, utilizar GridSearchCV + VotingClassifier para encontrar los mejores parámetros del modelo para los modelos individuales.

¡Comencemos!

Preparación de datos:

Para ver un ejemplo de VotingClassifier en acción, estoy utilizando el conjunto de datos de predicción de insuficiencia cardíaca (disponible bajo licencia de base de datos abierta). Aquí, la tarea es la clasificación binaria para predecir si un paciente con atributos específicos puede tener enfermedad cardíaca o no. El conjunto de datos tiene 10 atributos, incluyendo edad, sexo, presión arterial en reposo, etc., para datos recopilados de más de 900 pacientes. Veamos algunas distribuciones para diferentes parámetros. Verificamos los recuentos de ‘ClassLabel’ (1 representa enfermedad cardíaca, 0 representa saludable), es decir, población saludable y enferma en función del sexo.

Fig. 1: Distribución de ClassLabel en función del sexo de los participantes (Imagen del autor; Códigos en referencias).

En general, vemos que proporcionalmente hay más hombres enfermos en comparación con mujeres. También podemos verificar características individuales como la distribución de colesterol y presión arterial en reposo y vemos que tanto el colesterol como la presión arterial en reposo son más altos en pacientes enfermos, especialmente en mujeres.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

El año en que la inteligencia artificial se comió internet

Llamemos al 2023 el año en que muchos aprendimos a comunicarnos, crear, engañar y colaborar con robots.

Inteligencia Artificial

Científicos más cerca de encontrar una prueba para el COVID prolongado

Un equipo multiinstitucional de científicos podría haber descubierto biomarcadores de la COVID-19 prolongada que podr...

Inteligencia Artificial

¿Realmente se expondrán o perderán 300 millones de empleos debido a la sustitución por IA?

Los autores del informe de Goldman Sachs sugieren que 300 millones de empleos podrían verse afectados por la sustituc...

Inteligencia Artificial

La Desesperada Búsqueda del Premio Más Indispensable del Auge de la Inteligencia Artificial

Para alimentar los productos de inteligencia artificial, las nuevas empresas y los inversores están tomando medidas e...

Aprendizaje Automático

Forjado en Llamas Startup fusiona la IA Generativa y la Visión por Computadora para Combatir los Incendios Forestales.

Cuando los cielos de California se tornaron naranjas a raíz de los devastadores incendios forestales, una startup fus...