Ensamble Apilado para Modelado Predictivo Avanzado con H2O.ai y Optuna

Ensamble Apilado para Modelado Predictivo Avanzado con H2O.ai y Optuna La combinación perfecta

¡Y cómo me clasifiqué en el top 10% en la competencia de aprendizaje automático más grande de Europa con ellos!

Imagen generada por DALL·E 3, representando un paisaje apilado

Todos sabemos que los modelos de conjunto superan a cualquier modelo individual en el modelado predictivo. Probablemente hayas escuchado sobre Bagging y Boosting como métodos de conjunto comunes, con Bosques Aleatorios (Random Forests) y Máquinas de Reforzamiento de Gradiente (Gradient Boosting Machines) como ejemplos respectivos.

Pero ¿qué pasa si combinamos diferentes modelos bajo un modelo separado de nivel superior? Aquí es donde entran los conjuntos apilados. Este artículo es una guía paso a paso sobre cómo entrenar conjuntos apilados utilizando la popular biblioteca de aprendizaje automático, H2O.

Para demostrar el poder de los conjuntos apilados, proporcionaré un recorrido por todo mi código para entrenar un conjunto apilado de 40 modelos de Redes Neuronales Profundas, XGBoost y LightGBM para la tarea de predicción planteada en la Competencia de Codificación Cloudflight 2023 (Categoría de IA), una de las competencias de codificación más grandes de Europa, ¡donde me clasifiqué en el top 10% en el tablero de clasificación de la competencia en un tiempo de entrenamiento de 1 hora!

Esta guía cubrirá:

  1. ¿Qué son los conjuntos apilados y cómo funcionan?
  2. Cómo entrenar conjuntos apilados con H2O.ai
  3. Comparar el rendimiento de un conjunto apilado versus modelos independientes

1. ¿Qué son los Conjuntos Apilados?

Un conjunto apilado combina predicciones de múltiples modelos a través de otro modelo de nivel superior, con el objetivo de aumentar el rendimiento predictivo general al aprovechar las fortalezas únicas de cada modelo constituyente. Involucra 2 etapas:

Etapa 1: Múltiples Modelos Base

Primero, se entrenan múltiples modelos base de forma independiente en el mismo conjunto de datos de entrenamiento. Estos modelos idealmente deben ser diversos, desde simples regresiones lineales hasta modelos de aprendizaje profundo complejos. La clave es que deben diferir entre sí de alguna manera, ya sea en términos de algoritmo o configuraciones de hiperparámetros.

Cuanto más diversos sean los modelos base, más poderoso será el conjunto apilado resultante. Esto se debe a que los diferentes modelos son capaces de capturar diferentes patrones en los…

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Aprendizaje Automático

Científicos mejoran la detección de delirio utilizando Inteligencia Artificial y electroencefalogramas de respuesta rápida.

Detectar el delirio no es fácil, pero puede tener grandes beneficios: acelerar la atención esencial para los paciente...

Aprendizaje Automático

¿Qué son los Modelos de Lenguaje Grandes (LLMs)? Aplicaciones y Tipos de LLMs

Los programas informáticos llamados modelos de lenguaje grandes proporcionan opciones novedosas para analizar y crear...

Inteligencia Artificial

Células complejas del pulpo son clave para su alta inteligencia

Investigadores exploraron la estructura neural del pulpo que define sus procesos de aprendizaje utilizando preparació...

Inteligencia Artificial

Protección de datos fundamentales para la aceleración de LLM empresarial con Protopia AI

La publicación describe cómo puedes superar los desafíos de retener la propiedad de los datos y preservar la privacid...

Inteligencia Artificial

Construye aplicaciones de IA generativa listas para producción para la búsqueda empresarial utilizando tuberías de Haystack y Amazon SageMaker JumpStart con LLMs

En esta publicación, mostramos cómo construir una aplicación de IA generativa de extremo a extremo para la búsqueda e...

Inteligencia Artificial

Rendimiento máximo de IA las últimas actualizaciones de Adobe aceleradas por las GPU de NVIDIA mejoran los flujos de trabajo para millones de creativos.

La IA generativa está ayudando a los creativos de diversas industrias a dar vida a ideas a una velocidad sin preceden...