Nuevo curso técnico de inmersión profunda Fundamentos de IA generativa en AWS

Curso técnico Fundamentos de IA generativa en AWS

Generative AI Foundations on AWS es un nuevo curso de inmersión técnica que te brinda los fundamentos conceptuales, consejos prácticos y orientación práctica para preentrenar, afinar y implementar modelos base de última generación en AWS y más allá. Desarrollado por Emily Webber, líder mundial de fundamentos de generative AI en AWS, este curso práctico gratuito y el código fuente de GitHub de apoyo se lanzaron a través de AWS Youtube. Si estás buscando una lista seleccionada de los mejores recursos, conceptos y orientación para ponerte al día en modelos base, especialmente aquellos que desbloquean capacidades generativas en tus proyectos de ciencia de datos y aprendizaje automático, entonces no busques más.

En esta inmersión profunda de 8 horas, te presentaremos las técnicas clave, servicios y tendencias que te ayudarán a comprender los modelos base desde cero. Esto significa desglosar la teoría, las matemáticas y los conceptos abstractos combinados con ejercicios prácticos para adquirir intuición funcional para su aplicación práctica. A lo largo del curso, nos enfocamos en un amplio espectro de técnicas de generative AI progresivamente complejas, brindándote una base sólida para comprender, diseñar y aplicar tus propios modelos para obtener el mejor rendimiento. Comenzaremos recapitulando los modelos base, comprendiendo de dónde vienen, cómo funcionan, cómo se relacionan con generative AI y qué puedes hacer para personalizarlos. Luego aprenderás a elegir el modelo base adecuado para tu caso de uso.

Una vez que hayas desarrollado una comprensión contextual sólida de los modelos base y cómo usarlos, te presentaremos el tema principal de este curso: el preentrenamiento de nuevos modelos base. Aprenderás por qué querrías hacer esto, así como cómo y dónde es competitivo. Incluso aprenderás cómo utilizar las leyes de escalamiento para elegir el modelo, el conjunto de datos y los tamaños de cómputo adecuados. Cubriremos la preparación de conjuntos de datos de entrenamiento a gran escala en AWS, incluida la selección de las instancias y técnicas de almacenamiento adecuadas. También cubriremos el ajuste fino de tus modelos base, evaluando técnicas recientes y comprendiendo cómo ejecutarlos con tus guiones y modelos. Nos sumergiremos en el aprendizaje por refuerzo con retroalimentación humana, explorando cómo utilizarlo de manera hábil y a gran escala para maximizar verdaderamente el rendimiento de tu modelo base.

Finalmente, aprenderás cómo aplicar la teoría a la producción mediante la implementación de tu nuevo modelo base en Amazon SageMaker, incluido el uso de múltiples GPUs y el uso de patrones de diseño principales como generación aumentada de recuperación y diálogo encadenado. Como bonificación adicional, te guiaremos en una inmersión profunda de Stable Diffusion, las mejores prácticas de ingeniería de prompts, la configuración de LangChain y más.

¿Eres más de leer que de ver videos? Puedes consultar mi libro de 15 capítulos “Pretrain Vision and Large Language Models in Python: Técnicas de principio a fin para construir e implementar modelos base en AWS”, que se lanzó el 31 de mayo de 2023, con la editorial Packt y está disponible ahora en Amazon. ¿Quieres ir directamente al código? Estoy contigo: cada video comienza con una descripción general de 45 minutos de los conceptos clave y visuales. Luego te mostraré una demostración práctica de 15 minutos. Todos los cuadernos de ejemplos y el código de apoyo se enviarán en un repositorio público, que puedes utilizar para seguir paso a paso por tu cuenta. No dudes en comunicarte conmigo a través de VoAGI, LinkedIn, GitHub o a través de tus equipos de AWS. Obtén más información sobre generative AI en AWS.

¡Felices senderos!

Esquema del curso

1. Introducción a los modelos base

  • ¿Qué son los grandes modelos de lenguaje y cómo funcionan?
  • ¿De dónde vienen?
  • ¿Cuáles son otros tipos de generative AI?
  • ¿Cómo personalizar un modelo base?
  • ¿Cómo evaluar un modelo generativo?
  • Demostración práctica: Modelos base en SageMaker

Diapositivas de la lección 1

Recursos prácticos de la lección 1

2. Elección del modelo base adecuado

  • Por qué es importante comenzar con el modelo base adecuado
  • Teniendo en cuenta el tamaño
  • Teniendo en cuenta la precisión
    • Teniendo en cuenta la facilidad de uso
  • Teniendo en cuenta las licencias
  • Teniendo en cuenta ejemplos anteriores de este modelo que funcionaron bien en tu industria
    • Teniendo en cuenta los puntos de referencia externos

Diapositivas de la lección 2

Recursos prácticos de la lección 2

3. Usando modelos de base pre-entrenados: ingeniería de prompts y ajuste fino

  • Los beneficios de comenzar con un modelo de base pre-entrenado
  • Ingeniería de prompts:
    • Zero-shot
    • Single-shot
    • Few-shot
    • Summarization
      • Clasificación
    • Traducción
  • Ajuste fino
    • Ajuste fino clásico
    • Ajuste fino eficiente en parámetros
    • La nueva biblioteca de Hugging Face
    • Guía práctica: ingeniería de prompts y ajuste fino en SageMaker

Diapositivas de la Lección 3

Recursos prácticos de la Lección 3

4. Pre-entrenando un nuevo modelo de base

  • ¿Por qué querrías o necesitarías crear un nuevo modelo de base?
    • Comparando el pre-entrenamiento con el ajuste fino
  • Preparando tu conjunto de datos para el pre-entrenamiento
  • Entrenamiento distribuido en SageMaker: bibliotecas, scripts, trabajos, recursos
  • Por qué y cómo adaptar un nuevo script al entrenamiento distribuido de SageMaker

Diapositivas de la Lección 4

Recursos prácticos de la Lección 4

5. Preparando datos y entrenando a gran escala

  • Opciones para preparar datos a gran escala en AWS
  • Explicación de la paralelización del trabajo de SageMaker en instancias de CPU
  • Explicación de los modos de enviar datos al entrenamiento de SageMaker
  • Introducción a FSx for Lustre
  • Usando FSx for Lustre a gran escala para el entrenamiento de SageMaker
  • Guía práctica: configuración de Lustre para el entrenamiento de SageMaker

Diapositivas de la Lección 5

Recursos prácticos de la Lección 5

6. Aprendizaje por refuerzo con retroalimentación humana

  • ¿Qué es esta técnica y por qué nos importa?
  • Cómo supera los problemas de subjetividad y objetividad mediante la clasificación de preferencias humanas a gran escala
  • ¿Cómo funciona?
  • Cómo hacer esto con SageMaker Ground Truth
  • Modelado de recompensa actualizado
  • Guía práctica: Aprendizaje por refuerzo con retroalimentación humana en SageMaker

Diapositivas de la Lección 6

Recursos prácticos de la Lección 6

7. Desplegando un modelo de base

  • ¿Por qué queremos desplegar modelos?
  • Diferentes opciones para desplegar FM en AWS
  • Cómo optimizar tu modelo para el despliegue
  • Profundizando en el contenedor de despliegue de modelos grandes
  • Principales consejos de configuración para desplegar FM en SageMaker
  • Consejos de ingeniería de prompts para invocar modelos de base
  • Usando generación con recuperación para mitigar alucinaciones
  • Guía práctica: Desplegando un FM en SageMaker

Diapositivas de la Lección 7

Recursos prácticos de la Lección 7

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Construye y entrena modelos de visión por computadora para detectar posiciones de autos en imágenes utilizando Amazon SageMaker y Amazon Rekognition

La visión por computadora (CV) es una de las aplicaciones más comunes del aprendizaje automático (ML) y el aprendizaj...

Inteligencia Artificial

Robot aprende a limpiar el espacio tal como te gusta

Los roboticistas desarrollaron un robot que puede limpiar espacios basándose en las preferencias personales de los us...

Ciencia de Datos

Incorpore SageMaker Autopilot en sus procesos de MLOps usando un Proyecto personalizado de SageMaker.

Cada organización tiene su propio conjunto de estándares y prácticas que proporcionan seguridad y gobernanza para su ...

Inteligencia Artificial

Premio Gordon Bell otorgado por simulaciones de materiales que logran precisión cuántica a gran escala

Un equipo de investigadores de instituciones estadounidenses e indias fue galardonado con el Premio Gordon Bell 2023 ...

Inteligencia Artificial

PoisonGPT Hugging Face LLM difunde noticias falsas

Los Grandes Modelos de Lenguaje (LLMs, por sus siglas en inglés) han ganado una popularidad significativa en todo el ...