AI Probabilístico que sabe qué tan bien está funcionando.

Probabilistic AI that knows how well it's working.

Es más importante que nunca que la inteligencia artificial estime con qué precisión está explicando los datos.

A new set of algorithms developed at MIT is unique among AI tools, in that it outputs explanations for data and estimates the accuracy of those explanations.

A pesar de su enorme tamaño y poder, los sistemas de inteligencia artificial actuales fallan rutinariamente en distinguir entre alucinación y realidad. Los sistemas de conducción autónoma pueden fallar al percibir a los peatones y vehículos de emergencia justo delante de ellos, con consecuencias fatales. Los sistemas de inteligencia artificial conversacional inventan hechos con confianza y, después de entrenarse mediante aprendizaje por refuerzo, a menudo no pueden dar estimaciones precisas de su propia incertidumbre.

Trabajando juntos, investigadores del MIT y de la Universidad de California en Berkeley han desarrollado un nuevo método para construir sofisticados algoritmos de inferencia de inteligencia artificial que generan simultáneamente colecciones de explicaciones probables para los datos y estiman con precisión la calidad de estas explicaciones.

El nuevo método se basa en un enfoque matemático llamado Monte Carlo secuencial (SMC). Los algoritmos SMC son un conjunto establecido de algoritmos que se han utilizado ampliamente para la inteligencia artificial calibrada por incertidumbre, proponiendo explicaciones probables de los datos y rastreando lo probable o improbable que parecen las explicaciones propuestas cada vez que se dispone de más información. Pero SMC es demasiado simplista para tareas complejas. El problema principal es que uno de los pasos centrales del algoritmo, el paso de idear en realidad suposiciones para explicaciones probables (antes del otro paso de rastrear lo probable que parecen diferentes hipótesis en relación entre sí), tenía que ser muy simple. En áreas de aplicación complicadas, observar los datos y deducir suposiciones plausibles sobre lo que está sucediendo puede ser un problema desafiante por sí solo. En la conducción autónoma, por ejemplo, esto requiere observar los datos de video de las cámaras de un automóvil autónomo, identificar los coches y peatones en la carretera y adivinar las trayectorias de movimiento probables de los peatones que actualmente están ocultos a la vista. Hacer suposiciones plausibles a partir de datos crudos puede requerir algoritmos sofisticados que el SMC regular no puede admitir.

Aquí es donde entra en juego el nuevo método, SMC con propuestas de programas probabilísticos (SMCP3). SMCP3 permite utilizar formas más inteligentes de idear explicaciones probables de los datos, actualizar esas explicaciones propuestas a la luz de nueva información y estimar la calidad de estas explicaciones que se propusieron de formas sofisticadas. SMCP3 lo hace posible al permitir el uso de cualquier programa probabilístico, cualquier programa de computadora que también tenga permitido hacer elecciones aleatorias, como estrategia para proponer (es decir, adivinar de manera inteligente) explicaciones de datos. Las versiones anteriores de SMC solo permitían el uso de estrategias muy simples, tan simples que se podía calcular la probabilidad exacta de cualquier conjetura. Esta restricción dificultaba el uso de procedimientos de adivinación con múltiples etapas.

El artículo SMCP3 de los investigadores muestra que, al utilizar procedimientos de proposición más sofisticados, SMCP3 puede mejorar la precisión de los sistemas de inteligencia artificial para rastrear objetos 3D y analizar datos, y también mejorar la precisión de las propias estimaciones de los algoritmos sobre lo probable que son los datos. Investigaciones anteriores del MIT y otros han demostrado que estas estimaciones se pueden utilizar para inferir con qué precisión un algoritmo de inferencia está explicando los datos, en relación con un razonador bayesiano idealizado.

George Matheos, coautor principal del artículo (y estudiante de doctorado en ingeniería eléctrica y ciencias de la computación [EECS] del MIT), dice que está más entusiasmado con el potencial de SMCP3 para hacer que sea práctico utilizar algoritmos bien entendidos y calibrados por incertidumbre en entornos de problemas complicados donde las versiones anteriores de SMC no funcionaron.

“Hoy en día, tenemos muchos nuevos algoritmos, muchos basados en redes neuronales profundas, que pueden proponer lo que podría estar sucediendo en el mundo, a la luz de los datos, en todo tipo de áreas problemáticas. Pero a menudo, estos algoritmos no están realmente calibrados por incertidumbre. Simplemente producen una idea de lo que podría estar sucediendo en el mundo, y no está claro si esa es la única explicación plausible o si hay otras, o incluso si esa es una buena explicación en primer lugar. Pero con SMCP3, creo que será posible utilizar muchos más de estos algoritmos inteligentes pero difíciles de confiar para construir algoritmos calibrados por incertidumbre. A medida que utilizamos sistemas de ‘inteligencia artificial’ para tomar decisiones en cada vez más áreas de la vida, tener sistemas en los que podamos confiar, que sean conscientes de su incertidumbre, será crucial para la confiabilidad y la seguridad”, explicó.

Vikash Mansinghka, autor principal del artículo, agrega: “Las primeras computadoras electrónicas se construyeron para ejecutar métodos de Monte Carlo, y son algunas de las técnicas más ampliamente utilizadas en la informática y en la inteligencia artificial. Pero desde el principio, los métodos de Monte Carlo han sido difíciles de diseñar e implementar: las matemáticas tenían que ser derivadas a mano, y había muchas restricciones matemáticas sutiles de las que los usuarios tenían que ser conscientes. SMCP3 automatiza simultáneamente las matemáticas difíciles y amplía el espacio de diseños. Ya lo hemos utilizado para pensar en nuevos algoritmos de inteligencia artificial que no podríamos haber diseñado antes”.

Los otros autores del artículo incluyen al coautor principal Alex Lew (estudiante de doctorado en EECS del MIT); estudiantes de doctorado en EECS del MIT Nishad Gothoskar, Matin Ghavamizadeh y Tan Zhi-Xuan; y Stuart Russell, profesor en UC Berkeley. El trabajo se presentó en la conferencia AISTATS en Valencia, España, en abril.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Mejora Amazon Lex con características de preguntas frecuentes conversacionales utilizando LLMs

Amazon Lex es un servicio que te permite construir de manera rápida y sencilla bots conversacionales (chatbots), agen...

Inteligencia Artificial

El equipo de Estabilidad AI presenta FreeWilly1 y FreeWilly2 Nuevos Modelos de Lenguaje de Acceso Abierto y Gran Tamaño (LLMs)

FreeWilly1 y su sucesor FreeWilly2 son nuevos y potentes modelos de lenguaje de código abierto (LLMs) desarrollados p...

Noticias de Inteligencia Artificial

Conoce a Robocat de DeepMind Un nuevo modelo de IA diseñado para operar múltiples robots.

Los robots están entrando rápidamente en la cultura mainstream, pero típicamente están limitados en sus habilidades d...

Inteligencia Artificial

¡Construye y juega! ¡Tu propio modelo V&L equipado con LLM!

Los modelos de lenguaje grandes (LLM) están demostrando cada vez más su valor. La incorporación de imágenes en los LL...