Microsoft Research lanza el ‘Cuarteto de Heavy Metal’ de los compiladores de IA Rammer, Roller, Welder y Grinder

Microsoft Research lanza los compiladores de IA Rammer, Roller, Welder y Grinder, el 'Cuarteto de Heavy Metal'.

La evolución de los modelos de inteligencia artificial (IA) y los aceleradores de hardware ha traído desafíos únicos para los compiladores. Estos desafíos se derivan de la arquitectura en constante evolución de los modelos de IA, como la transición de RNN y CNN a modelos más recientes como Transformers, junto con los avances rápidos en aceleradores de hardware como GPUs y NPUs. Como resultado, la compilación eficiente se ha vuelto crucial para garantizar que estos nuevos modelos de IA puedan funcionar de manera efectiva en hardware moderno.

Los compiladores tradicionales de IA generalmente han enfrentado limitaciones al optimizar la ejecución de redes neuronales profundas (DNN). Los compiladores actuales tratan la computación de DNN como flujos de datos con funciones de biblioteca opacas, lo que resulta en una programación de dos niveles que incurre en una sobrecarga significativa y recursos de hardware subutilizados. Además, la partición de datos y la optimización del acceso a memoria para modelos de IA pueden llevar mucho tiempo.

Por último, la mayoría de los compiladores de IA se han centrado principalmente en optimizar la ejecución de flujos de datos, prestando atención a la ejecución eficiente del código de flujo de control dentro de los modelos de IA. Esta limitación afecta a los modelos con lógica de control compleja, obstaculizando su capacidad para aprovechar al máximo la aceleración de hardware.

Un grupo de investigadores de Microsoft Research presentó un conjunto innovador de compiladores de IA llamados el “cuarteto de heavy metal”. Este cuarteto incluye a Rammer, Roller, Welder y Grinder, cada uno diseñado para abordar aspectos específicos de la compilación de IA.

  • Rammer: Rammer redefine el espacio de programación para la compilación de IA como un plano bidimensional y optimiza la ejecución de cargas de trabajo de DNN en unidades de aceleración paralela masiva. Rammer minimiza la sobrecarga de programación en tiempo de ejecución al organizar tareas computacionales como “ladrillos” en este plano, mejorando significativamente la utilización del hardware.
  • Roller: Roller optimiza la eficiencia de la compilación formulando estrategias eficientes para la partición de bloques de datos. Genera núcleos altamente optimizados en segundos, logrando una mejora de tres órdenes de magnitud en el tiempo de compilación en comparación con los compiladores existentes.
  • Welder: Welder optimiza de manera integral la eficiencia del acceso a memoria para modelos de DNN, reduciendo la brecha entre el ancho de banda de memoria y la utilización del núcleo de cálculo. Logra mejoras de rendimiento notables en varios modelos de DNN y compiladores.
  • Grinder: Grinder se enfoca en optimizar la ejecución de flujo de control dentro de los modelos de IA, integrando eficientemente el flujo de control en el flujo de datos para una ejecución eficiente en aceleradores de hardware. Logra mejoras sustanciales de velocidad para modelos de DNN con flujo de control intensivo.

El rendimiento del cuarteto se evaluó en varios dispositivos y modelos de IA. Rammer superó a los compiladores de vanguardia, logrando mejoras de velocidad de hasta 20.1 veces en GPUs. Roller demostró una reducción de tres órdenes de magnitud en el tiempo de compilación manteniendo un rendimiento competitivo. Welder superó los marcos y compiladores existentes hasta 21.4 veces, con mejoras aún más significativas en hardware con núcleos de cálculo más rápidos. Grinder logró una aceleración de hasta 8.2 veces en modelos de DNN con flujo de control intensivo, convirtiéndolo en el más rápido entre los compiladores de DNN para el flujo de control.

En conclusión, a medida que los modelos de IA y el hardware continúan evolucionando, el papel de los compiladores en garantizar una ejecución eficiente se vuelve aún más vital. Las contribuciones del cuarteto en este sentido abren el camino para una implementación de IA más efectiva en una variedad de aplicaciones, desde reconocimiento de imágenes hasta procesamiento de lenguaje natural (NLP), avanzando así las capacidades de la tecnología de IA en el mundo digital.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

La Gran Fuga de Datos Genéticos Lo que Necesitas Saber

Se ha iniciado una demanda colectiva contra una empresa de pruebas genéticas debido al robo de datos genéticos person...

Aprendizaje Automático

Meta AI presenta I-JEPA revolucionario Un gran salto innovador en la visión por computadora que emula el aprendizaje y el razonamiento humano y animal.

Los humanos recogen una gran cantidad de información de fondo sobre el mundo simplemente observándolo. El equipo de M...

Inteligencia Artificial

Conoce ConceptGraphs Una representación gráfica estructurada de vocabulario abierto para escenas en 3D

La captura y codificación de información sobre una escena visual, típicamente en el contexto de la visión por computa...

Inteligencia Artificial

Microsoft lanza TypeChat una biblioteca de IA que facilita la creación de interfaces de lenguaje natural utilizando tipos.

La biblioteca TypeChat de Microsoft es un intento de facilitar la creación de interfaces de lenguaje natural basadas ...

Inteligencia Artificial

Kinara presenta el procesador Ara-2 revolucionando el procesamiento de IA en dispositivos para un rendimiento mejorado

Kinara, una entidad pionera en inteligencia artificial energéticamente eficiente en el dispositivo, ha presentado su ...