Visualizando la Validación Cruzada de Sklearn K-Fold, Mezcla y División, y División de Series Temporales

Visualización de Validación Cruzada en Sklearn

Visualización del proceso de validación cruzada Sklearn K-Fold, Shuffle & Split y Time Series Split y muestra de resultados de validación usando Python

Foto de Ryoji Iwata en Unsplash

¿Qué es la validación cruzada?

Básicamente, la validación cruzada es un método estadístico para evaluar algoritmos de aprendizaje. Se establece un número fijo de pliegues (grupos de datos) para ejecutar el análisis. Estos pliegues agrupan los datos en 2 conjuntos: conjuntos de entrenamiento y prueba (validación), que se cruzan en rondas, permitiendo que cada punto de datos sea validado.

El objetivo principal es probar la capacidad del modelo para predecir datos independientes que no se utilizaron en su creación. También es útil para hacer frente a problemas como el sobreajuste o el sesgo de selección.

Un ejemplo de resultados de validaciones cruzadas en este artículo. Imagen de autor.

En este artículo, vamos a aplicar Python para visualizar el proceso de 3 tipos de validación cruzada de la biblioteca Scikit Learn:

  • Validación cruzada K-Fold
  • Validación cruzada Shuffle & Split
  • Validación cruzada Time Series Split

Además, los resultados de validación también se pueden representar gráficamente para expresar información perspicaz.

Empecemos

1. Validación cruzada K-Fold

K-fold es un método común para la validación cruzada. En primer lugar, todos los datos se dividen en pliegues. Luego, se crea el modelo de aprendizaje a partir del conjunto de entrenamiento (k-1 pliegues) y el conjunto de prueba (el pliegue restante) se utiliza para la validación.

Normalmente, los pliegues obtenidos de la validación cruzada K-Fold se dividen de manera lo más equitativa posible. A continuación, vamos a ver el proceso de la validación cruzada K-Fold.

Importar bibliotecas y cargar datos

Por ejemplo, este artículo trabajará con el conjunto de datos de vino, que se puede descargar de la biblioteca Sklearn. El conjunto de datos es una copia de los datos de vino de UCI ML bajo la licencia CC BY 4.0.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

De las palabras a los mundos Explorando la narración de videos con la descripción de video fina y detallada multimodal de IA

El lenguaje es el modo predominante de interacción humana, ofreciendo más que solo detalles complementarios a otras f...

Aprendizaje Automático

Red Cat y Athena AI crean drones militares inteligentes con visión nocturna.

Red Cat Holdings, Inc., una empresa líder en tecnología militar, ha logrado un hito en su colaboración con Athena AI....

Ciencia de Datos

Series de tiempo para el cambio climático Pronóstico de demanda origen-destino

La minería de datos de vehículos en movimiento es una tarea clave en los sistemas de transporte inteligentes. Los dat...

Inteligencia Artificial

Apoyando la sostenibilidad, la salud digital y el futuro del trabajo

La Iniciativa de Convergencia MIT y Accenture para la Industria y la Tecnología selecciona tres nuevos proyectos de i...

Inteligencia Artificial

Datos de navegación web recopilados con más detalle de lo que se conocía anteriormente.

Según un informe del Irish Council for Civil Liberties, se está recopilando y vendiendo datos de navegación web con m...

Inteligencia Artificial

Ayudando a la Visión por Computadora y a los Modelos de Lenguaje a Comprender lo que Ven

El Instituto de Tecnología de Massachusetts y otros investigadores desarrollaron una técnica que utiliza datos genera...