Acélere los resultados comerciales con mejoras del 70% en el rendimiento del procesamiento de datos, entrenamiento e inferencia con Amazon SageMaker Canvas

Aumente el rendimiento del procesamiento de datos, entrenamiento e inferencia en un 70% con Amazon SageMaker Canvas para mejorar los resultados comerciales

Amazon SageMaker Canvas es una interfaz visual que permite a los analistas de negocios generar predicciones precisas de aprendizaje automático (ML) por sí mismos, sin necesidad de tener experiencia en ML o de escribir una sola línea de código. La interfaz intuitiva de SageMaker Canvas permite a los analistas de negocios navegar y acceder a diversas fuentes de datos en la nube o en las instalaciones, preparar y explorar los datos, construir y entrenar modelos de ML, y generar predicciones precisas dentro de un único espacio de trabajo.

SageMaker Canvas permite a los analistas utilizar diferentes cargas de trabajo de datos para lograr los resultados comerciales deseados con alta precisión y rendimiento. Los requisitos de computación, almacenamiento y memoria para generar predicciones precisas se abstraen del usuario final, lo que les permite centrarse en el problema comercial que se debe resolver. A principios de este año, anunciamos optimizaciones de rendimiento basadas en los comentarios de los clientes para ofrecer tiempos de entrenamiento de modelos más rápidos y precisos con SageMaker Canvas.

En esta publicación, mostramos cómo SageMaker Canvas ahora puede procesar datos, entrenar modelos y generar predicciones con mayor velocidad y eficiencia para diferentes tamaños de conjunto de datos.

Prerrequisitos

Si deseas seguir los pasos, completa los siguientes prerrequisitos:

  1. Tener una cuenta de AWS.
  2. Configurar SageMaker Canvas. Para obtener instrucciones, consulta los Prerrequisitos para configurar Amazon SageMaker Canvas.
  3. Descargar los siguientes dos conjuntos de datos en tu computadora local. El primero es el conjunto de datos de viajes en taxi amarillo de Nueva York; el segundo es el conjunto de datos de comportamiento de comercio electrónico relacionado con eventos minoristas de productos y usuarios.

Ambos conjuntos de datos están bajo la licencia de Atribución 4.0 Internacional (CC BY 4.0) y se pueden compartir y adaptar de forma gratuita.

Mejoras en el procesamiento de datos

Con las optimizaciones de rendimiento subyacentes, el tiempo de importación de datos en SageMaker Canvas ha mejorado en más del 70%. Ahora puedes importar conjuntos de datos de hasta 2 GB en aproximadamente 50 segundos y hasta 5 GB en aproximadamente 65 segundos.

Después de importar los datos, los analistas de negocios suelen validar los datos para asegurarse de que no haya problemas en el conjunto de datos. Algunos ejemplos de validación pueden ser asegurarse de que las columnas contengan el tipo de datos correcto, verificar si los rangos de valores están en línea con las expectativas, asegurarse de que haya unicidad en los valores cuando corresponda, entre otros.

La validación de datos ahora es más rápida. En nuestras pruebas, todas las validaciones llevaban 50 segundos para el conjunto de datos de taxi que supera los 5 GB de tamaño, una mejora de 10 veces en la velocidad.

Mejoras en el entrenamiento de modelos

Las optimizaciones de rendimiento relacionadas con el entrenamiento de modelos de ML en SageMaker Canvas ahora te permiten entrenar modelos sin encontrar posibles fallos de solicitudes fuera de memoria.

La siguiente captura de pantalla muestra los resultados de una ejecución de construcción exitosa utilizando un conjunto de datos grande y el impacto de la característica total_amount en la variable objetivo.

Mejoras en la inferencia

Finalmente, las mejoras en la inferencia de SageMaker Canvas lograron una reducción del 3.5 veces en el consumo de memoria en caso de conjuntos de datos más grandes en nuestras pruebas internas.

Conclusión

En esta publicación, vimos varias mejoras con SageMaker Canvas en la importación, validación, entrenamiento e inferencia de datos. Observamos un aumento en su capacidad para importar conjuntos de datos grandes en un 70%. Vimos una mejora de 10 veces en la validación de datos y una reducción del 3.5 veces en el consumo de memoria. Estas mejoras te permiten trabajar mejor con conjuntos de datos grandes y reducir el tiempo al construir modelos de ML con SageMaker Canvas.

Te animamos a que experimentes las mejoras tú mismo. Agradecemos tus comentarios mientras trabajamos continuamente en optimizaciones de rendimiento para mejorar la experiencia del usuario.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Desde el Internet de las Cosas hasta el Internet de Todo La Convergencia de la IA y el 6G para una Inteligencia Conectada

Aprende cómo las tecnologías de vanguardia como la Inteligencia Artificial y el 6G inaugurarán una nueva era de siste...

Inteligencia Artificial

Nuevo ataque afecta a importantes chatbots de IA y nadie sabe cómo detenerlo

Investigadores encontraron una forma sencilla de hacer que ChatGPT, Bard y otros chatbots se comporten mal, demostran...

Inteligencia Artificial

Oracle Cloud Infrastructure ofrece nuevas instancias de cómputo aceleradas por GPU NVIDIA

Con la inteligencia artificial generativa y los grandes modelos de lenguaje (LLMs) impulsando innovaciones revolucion...