CatBoost Regresión Explícamelo detalladamente

CatBoost Regresión Explícamelo detalladamente' can be condensed to 'Explícame CatBoost Regresión en detalle'.

Una desglose completa (e ilustrada) de las entrañas de CatBoost

CatBoost, abreviatura de Categorical Boosting, es un poderoso algoritmo de aprendizaje automático que se destaca en el manejo de características categóricas y en la producción de predicciones precisas. Tradicionalmente, lidiar con datos categóricos es bastante complicado, requiriendo codificación one-hot, codificación de etiquetas o alguna otra técnica de preprocesamiento que puede distorsionar la estructura inherente de los datos. Para abordar este problema, CatBoost utiliza su propio sistema de codificación incorporado llamado Codificación Objetivo Ordenada.

Vamos a ver cómo trabaja CatBoost en la práctica construyendo un modelo para predecir cómo alguien podría calificar el libro “Murder, She Texted” en función de su calificación promedio de libros en Goodreads y su género favorito.

Pedimos a 6 personas que calificaran el libro “Murder, She Texted” y recopilamos otra información relevante sobre ellas.

Este es nuestro conjunto de entrenamiento actual, que utilizaremos para entrenar (obvio) los datos.

Paso 1: Mezclar el conjunto de datos y Codificar los Datos Categóricos Usando Codificación Objetivo Ordenada

La forma en que preprocesamos los datos categóricos es fundamental para el algoritmo CatBoost. En este caso, solo tenemos una columna categórica: Género Favorito. Esta columna se codifica (es decir, se convierte en un entero discreto) y la forma en que se hace varía según si es un problema de Regresión o Clasificación. Dado que estamos tratando con un problema de Regresión (porque la variable que queremos predecir, Murder, She Texted Rating, es continua), seguimos los siguientes pasos.

1 – Mezclar el conjunto de datos:

2 – Colocar la variable objetivo continua en intervalos discretos: Dado que tenemos muy pocos datos aquí, crearemos 2 intervalos del mismo tamaño para categorizar la variable objetivo. (Aprende más sobre cómo crear intervalos aquí).

Colocamos los 3 valores más pequeños de Murder, She Texted Rating en el intervalo 0 y el resto en el intervalo 1.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Chipotle presenta Autocado, un robot de preparación de guacamole

Chipotle se ha asociado con la firma de soluciones de automatización Vebu para presentar Autocado, un robot de proces...

Inteligencia Artificial

Un caso que rima con Microsoft

La lección predominante del caso de Microsoft, según los abogados antimonopolio, es que el escrutinio de Washington p...

Inteligencia Artificial

¿Pueden los LLM reemplazar a los analistas de datos? Construyendo un analista potenciado por LLM

Creo que cada uno de nosotros se ha preguntado al menos una vez durante el año pasado si (o más bien cuándo) ChatGPT ...

Inteligencia Artificial

Honda comenzará un servicio de taxis sin conductor en Tokio, según el CEO

La alianza con GM, Cruise tiene como objetivo eventual contar con 500 robotaxis.