Investigadores de Princeton presentan InterCode un revolucionario marco ligero que simplifica la interacción del modelo de lenguaje para generar código de manera similar a como lo haría un humano.

Investigadores de Princeton presentan InterCode, un marco ligero que simplifica la generación de código al interactuar con el modelo de lenguaje de manera similar a un humano.

ChatGPT, el último chatbot desarrollado por OpenAI, ha estado en los titulares desde su lanzamiento. Este modelo basado en la arquitectura GPT transformer imita a los humanos al responder preguntas con precisión como lo haría un humano, genera contenido para blogs, redes sociales, investigación, etc., traduce idiomas, resume párrafos largos mientras retiene los puntos clave importantes e incluso genera ejemplos de código. Modelos de Lenguaje Grandes como GPT, BERT, PaLM y LLaMa han contribuido con éxito al avance en el campo de la Inteligencia Artificial. Estos modelos de aprendizaje profundo han utilizado eficazmente el potencial del Procesamiento del Lenguaje Natural y la Comprensión del Lenguaje Natural.

En tiempos recientes, el desarrollo de modelos que pueden producir automáticamente código a partir de especificaciones en lenguaje natural ha ganado popularidad. Aunque estos modelos han demostrado un rendimiento impresionante en pruebas estáticas debido al extenso preentrenamiento en miles de bases de código, también existen ciertas limitaciones, como errores tipográficos, brechas entre el proceso de creación del código y su ejecución, participación humana limitada, etc.

Para abordar estos desafíos, investigadores del Departamento de Ciencias de la Computación de la Universidad de Princeton han propuesto un marco ligero y flexible llamado InterCode que facilita la codificación interactiva como un entorno de aprendizaje por refuerzo estándar (RL). En InterCode, el código se trata como acciones y la retroalimentación de ejecución se considera como observaciones. Este método basado en RL hace que la codificación sea más iterativa y se puede utilizar con muchos lenguajes de programación y entornos porque está diseñado para ser independiente del lenguaje y la plataforma.

InterCode también utiliza entornos Docker independientes para garantizar una ejecución segura y repetible. Ha sido diseñado para ser compatible con técnicas de codificación de secuencia a secuencia (seq2seq) convencionales, lo que lo hace simple de adoptar e incorporar en los métodos actuales. Puede permitir fácilmente el desarrollo de nuevos enfoques específicamente diseñados para la generación de código interactiva.

Para la evaluación, el equipo ha construido dos entornos de código interactivo utilizando Bash y SQL como espacios de acciones para ilustrar la utilidad de InterCode. Han entrenado y evaluado algunos modelos de lenguaje excelentes equipados con diversas tácticas de estímulo, como ReAct y Plan & Solve, utilizando datos de los conjuntos de datos estáticos Spider y NL2Bash. Los experimentos de InterCode demostraron las ventajas de la producción de código interactivo al enfatizar su potencial como una prueba difícil para mejorar la comprensión del código y las capacidades de generación.

El equipo ha resumido las principales contribuciones de la siguiente manera:

  1. Se ha introducido InterCode, un nuevo y universal marco para la generación de código interactivo, que proporciona facilidad de uso, extensibilidad y seguridad. Es amigable para el usuario y accesible, lo que permite a los investigadores utilizarlo fácilmente en sus experimentos.
  1. Se han accedido y evaluado algunos modelos increíbles de última generación utilizando InterCode, y se han señalado varias mejoras potenciales.
  1. La referencia de InterCode sirve como una plataforma de evaluación estandarizada para tareas de generación de código interactivo, y permite a los investigadores comparar el rendimiento de diferentes modelos utilizando un marco común. Transforma cualquier conjunto de datos nuevo de código estático en actividades interactivas.

En conclusión, InterCode es un enfoque prometedor y una gran adición a los desarrollos en el campo de la Inteligencia Artificial. Mejora en gran medida la generación de código interactivo, proporcionando así una plataforma de evaluación estandarizada y fomentando una mayor investigación y desarrollo en esta área.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Aprendizaje Automático

Ajusta de forma interactiva Falcon-40B y otros LLMs en los cuadernos de Amazon SageMaker Studio utilizando QLoRA.

Ajustar modelos de lenguaje grandes (LLMs) permite adaptar modelos fundamentales de código abierto para lograr un mej...

Aprendizaje Automático

Acelerando el Acelerador Científico Acelera la Computación de Alto Rendimiento de CERN con GPUs y IA.

Nota del editor: Esto es parte de una serie que perfila a investigadores que avanzan en la ciencia con cómputo de alt...

Inteligencia Artificial

Analógico y Digital Lo Mejor de Ambos Mundos en un Sistema Eficiente en Energía

Un nuevo dispositivo combina semiconductores bidimensionales ultrafinos y materiales ferroeléctricos, con el objetivo...

Inteligencia Artificial

La Casa Blanca propone un programa de ciberseguridad para hogares inteligentes

El objetivo de la nueva certificación es ayudar a los consumidores a tomar decisiones.