La última investigación de DeepMind en ICLR 2022

Investigación reciente de DeepMind en ICLR 2022.

Trabajando hacia una mayor generalización en la inteligencia artificial

Hoy, la temporada de conferencias comienza con la Décima Conferencia Internacional sobre Representaciones de Aprendizaje (ICLR 2022), que se celebra de forma virtual del 25 al 29 de abril de 2022. Participantes de todo el mundo se están reuniendo para compartir su trabajo de vanguardia en aprendizaje representacional, desde el avance del estado del arte en inteligencia artificial hasta ciencia de datos, visión por computadora, robótica y más.

En el primer día de la conferencia, Pushmeet Kohli, nuestro jefe de IA para Ciencia y los equipos de IA Robusta y Verificada, está dando una charla sobre cómo la IA puede mejorar drásticamente las soluciones a una amplia gama de problemas científicos, desde genómica y biología estructural hasta química cuántica e incluso matemáticas puras.

Además de apoyar el evento como patrocinadores y organizadores habituales de talleres, nuestros equipos de investigación están presentando 29 papers, incluyendo 10 colaboraciones este año. Aquí hay un breve vistazo a nuestras próximas presentaciones orales, destacadas y de póster:

Optimizando el aprendizaje

Varios papers clave se centran en las formas críticas en las que estamos haciendo que el proceso de aprendizaje de nuestros sistemas de IA sea más eficiente. Esto incluye el aumento del rendimiento, el avance del aprendizaje con pocas muestras y la creación de sistemas eficientes en el uso de datos que reducen los costos computacionales.

En “Meta-aprendizaje bootstrap” , un ganador del Premio al Mejor Paper en ICLR 2022, proponemos un algoritmo que permite a un agente aprender a aprender enseñándose a sí mismo. También presentamos un algoritmo de mejora de políticas que rediseña AlphaZero, nuestro sistema que se enseñó desde cero para dominar el ajedrez, el shogi y el Go, para seguir mejorando incluso cuando se entrena con un pequeño número de simulaciones; un regularizador que mitiga el riesgo de pérdida de capacidad en una amplia gama de agentes y entornos de RL; y una arquitectura mejorada para entrenar eficientemente modelos de atención.

Exploración

La curiosidad es una parte clave del aprendizaje humano, ayudando a avanzar en el conocimiento y las habilidades. De manera similar, los mecanismos de exploración permiten a los agentes de IA ir más allá del conocimiento preexistente y descubrir lo desconocido o probar algo nuevo.

Al avanzar en la pregunta “¿Cuándo deberían los agentes explorar?”, investigamos cuándo los agentes deberían cambiar al modo de exploración, en qué escalas de tiempo tiene sentido cambiar y qué señales determinan mejor cuánto tiempo y con qué frecuencia deben ser los períodos de exploración. En otro paper, presentamos un “bono de exploración de ganancia de información” que permite a los agentes superar las limitaciones de las recompensas intrínsecas en RL para poder aprender más habilidades.

IA Robusta

Para implementar modelos de ML en el mundo real, deben ser efectivos al cambiar entre el entrenamiento, las pruebas y nuevos conjuntos de datos. Comprender los mecanismos causales es esencial, permitiendo que algunos sistemas se adapten, mientras que otros luchan para enfrentar nuevos desafíos.

Ampliando la investigación en estos mecanismos, presentamos un marco experimental que permite un análisis detallado de la robustez frente a cambios en la distribución. La robustez también ayuda a protegerse contra los daños adversarios, ya sean involuntarios o dirigidos. En el caso de las corrupciones de imagen, proponemos una técnica que optimiza teóricamente los parámetros de modelos de imagen a imagen para disminuir los efectos de desenfoque, niebla y otros problemas comunes.

Comunicación emergente

Además de ayudar a los investigadores de ML a comprender cómo los agentes evolucionan su propia comunicación para completar tareas, los agentes de IA tienen el potencial de revelar ideas sobre los comportamientos lingüísticos dentro de las poblaciones, lo que podría llevar a una IA más interactiva y útil.

Trabajando con investigadores de Inria, Google Research y Meta AI, conectamos el papel de la diversidad dentro de las poblaciones humanas en la formación del lenguaje para resolver parcialmente una aparente contradicción en las simulaciones informáticas con agentes neuronales. Luego, debido a que construir mejores representaciones del lenguaje en IA es tan vital para comprender la comunicación emergente, también investigamos la importancia de ampliar el conjunto de datos, la complejidad de la tarea y el tamaño de la población como aspectos independientes. Además, también estudiamos los compromisos entre expresividad, complejidad e imprevisibilidad en juegos donde múltiples agentes se comunican para lograr un objetivo único.

Vea la gama completa de nuestro trabajo en ICLR 2022 aquí.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Papel de los Contratos de Datos en la Canalización de Datos

¿Qué son los Contratos de Datos? Un contrato de datos es un acuerdo o conjunto de reglas que define cómo debe estruct...

Inteligencia Artificial

Top 40 Herramientas de IA Generativa 2023

ChatGPT – GPT-4 GPT-4 es el último LLM de OpenAI, que es más innovador, preciso y seguro que sus predecesores. Tambié...

Inteligencia Artificial

Conoce a Falcon 180B El modelo de lenguaje más grande disponible públicamente con 180 mil millones de parámetros

La demanda de modelos de lenguaje potentes y versátiles se ha vuelto más apremiante en el procesamiento del lenguaje ...

Inteligencia Artificial

Construye aplicaciones de IA generativa listas para producción para la búsqueda empresarial utilizando tuberías de Haystack y Amazon SageMaker JumpStart con LLMs

En esta publicación, mostramos cómo construir una aplicación de IA generativa de extremo a extremo para la búsqueda e...

Inteligencia Artificial

Las Pruebas Asistidas por Computadora Abordan el Flujo de Fluidos

Los investigadores utilizan computadoras para demostrar que las ecuaciones pueden explotar.

Inteligencia Artificial

Google AI propone E3-TTS, una solución sencilla y eficiente de texto a voz basada en difusión para convertir texto en voz de manera fácil y completa.

En el aprendizaje automático, un modelo de difusión es un modelo generativo comúnmente utilizado para tareas de gener...