Primeras sesiones y ponentes anunciados para ODSC West 2023

First sessions and speakers announced for ODSC West 2023

ODSC West puede estar varios meses lejos todavía, pero ya hemos organizado emocionantes charlas, talleres y sesiones de capacitación de algunos de los principales expertos en IA y ciencia de datos. Échales un vistazo a continuación.

Impulsando el éxito para los vendedores mediante la incorporación de IA en la plataforma CRM

Sarah Kefayati|Científica de datos principal asociada|IBM

Esta sesión explorará cómo los algoritmos de IA pueden generar mejores recomendaciones mediante el análisis de las preferencias, el comportamiento y el historial de compras de los clientes. También revisarás la arquitectura y los componentes de diseño que permiten integrar recomendaciones personalizadas en nuestra plataforma CRM.

MLOps: Monitoreo y gestión del cambio

Oliver Zeigermann|Arquitecto de aprendizaje automático|Freelancer

Este taller discutirá las métricas que se pueden utilizar como sustituto para comprender el rendimiento de tu modelo. En la Parte 1 de esta sesión, harás lo siguiente: 

  • Simular la producción en un modelo de aprendizaje automático existente y detectar el cambio
  • Utilizar el servicio de aprendizaje automático OpenAPI
  • Utilizar Evidently, Prometheus y Grafana para monitorear y detectar el cambio

La Parte II cubrirá: 

  • Interpretar y analizar el cambio y qué hacer al respecto
  • Interpretar qué sucedió para causar el cambio y decidir qué hacer al respecto 
  • Una opción es volver a entrenar tu modelo con nuevos datos
  • Considerar replantear la arquitectura del modelo o los datos que estamos utilizando

Capturando CAP en una arquitectura de datos Kappa

Joep Kokkeler|Ingeniero de datos senior|Dataworkz NL

El teorema CAP establece que no se puede tener consistencia, disponibilidad y tolerancia a particiones al mismo tiempo, pero ¿qué sucede si elegir la arquitectura Kappa hace posible tenerlo todo? Esta sesión discutirá qué es Kappa y cómo se compara con Lambda, una arquitectura de microservicios y monolítica.

Sistema de detección de anomalías semisupervisado mediante algoritmo de apilamiento de conjuntos

Chuying Ma|Científica de datos senior|Walmart

Esta sesión explorará una arquitectura sistemática, flexible, extensible e integral de detección de anomalías para aumentar las etiquetas existentes y detectar anomalías con un costo bajo. El nuevo sistema es capaz de incorporar tanto modelos de aprendizaje automático tradicionales como modelos de detección de anomalías basados en aprendizaje profundo para generar un puntaje de anomalía unificado mediante el algoritmo de apilamiento de conjuntos para abordar diferentes tipos de anomalías simultáneamente.

Personalizando LLMs con un almacén de características

Jim Dowling|CEO|Hopsworks

Esta sesión te enseñará cómo personalizar LLMs utilizando un almacén de características y la ingeniería de consultas. Verás cómo se puede utilizar el almacén de características de código abierto, Hopsworks, para construir una aplicación LLM personalizada. Específicamente, verás:

  • Cómo crear plantillas para las consultas y cómo se pueden construir fácilmente e incluir en las consultas de los usuarios
  • Cómo completar las plantillas de consulta con datos contextuales en tiempo real, producidos por canalizaciones de características de transmisión, y datos específicos del usuario, producidos por canalizaciones de características por lotes
  • Cómo podemos incorporar documentos de bases de datos vectoriales en las consultas utilizando una combinación de entrada del usuario e historial de datos del usuario en el almacén de características

¿Qué es una base de datos de series de tiempo y por qué la necesito?

Jeff Tao|Fundador y CEO|TDengine

El aumento en el tamaño de los conjuntos de datos de series de tiempo plantea un gran desafío para los sistemas de gestión de bases de datos generales como las bases de datos relacionales y NoSQL. Esta sesión cubrirá las bases de datos de series de tiempo diseñadas específicamente, una solución para este desafío. Son mucho más eficientes en términos de velocidad de ingreso de datos, latencia de consulta y compresión de datos. También incluyen funciones analíticas especiales y características de gestión de datos para que puedas desarrollar aplicaciones de manera más fácil.

Técnicas de evaluación para modelos de lenguaje grandes

Rajiv Shah, PhD|Ingeniero de aprendizaje automático|Hugging Face

En esta sesión, aprenderás sobre la investigación existente sobre las capacidades de los LLMs versus los pequeños modelos tradicionales de ML. También discutirás si un LLM es la mejor solución y varias técnicas, incluyendo conjuntos de evaluación como EleutherAI Harness, enfoques de competencia directa y el uso de LLMs para evaluar otros LLMs. El tutorial también abordará factores sutiles que afectan la evaluación, incluyendo el papel de las indicaciones, la tokenización y los requisitos de precisión factual. Finalmente, se integrará una discusión sobre el sesgo y la ética del modelo en los ejemplos de trabajo.

Ciencia de Datos aplicada a Problemas de Manufactura

Angad Arora|Científico de Datos de Manufactura|Google

Esta sesión discutirá cómo la ciencia de datos puede ayudar a alcanzar 3 KPIs de manufactura: producir más, ser eficiente y optimizar la utilización de recursos, y enviar con la máxima calidad posible. Te sumergirás en ejemplos de proyectos clave que han influido en estos KPIs.

¿Qué sigue?

Únete a nosotros en ODSC West 2023 este noviembre para aprender más sobre estos temas y mucho, mucho más. Además, ahorrarás un 70% en tu pase presencial o virtual como parte de nuestra venta de Super Early Bird cuando te registres antes del viernes.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Descubre Davidsonian Scene Graph un marco de IA revolucionario para evaluar la IA de texto a imagen con precisión

Los modelos de texto a imagen (T2I) son difíciles de evaluar y a menudo dependen de métodos de generación y respuesta...

Inteligencia Artificial

El diagnóstico y tratamiento del cáncer podrían recibir un impulso de la IA

Se diseñó un nuevo algoritmo de aprendizaje automático para ayudar a los médicos a diagnosticar tipos específicos de ...

Inteligencia Artificial

Por qué la NASA está enviando secretos nacionales a la Luna

NASA trabajará con la startup Lonestar y la Isla de Man para enviar una carga de datos a la Luna el próximo febrero, ...

Inteligencia Artificial

Por qué los científicos se adentran en el mundo virtual

Un número creciente de investigadores científicos están utilizando la tecnología de realidad virtual (VR) en el labor...

Ciencia de Datos

¿Qué es los datos sintéticos?

Los datos sintéticos son, para decirlo sin rodeos, datos falsos. Es decir, datos que no son realmente de la población...