Revolutionizando la Navegación Investigadores del MIT Presentan un Nuevo Enfoque de Aprendizaje Automático para la Estabilización y Evitación de Obstáculos en Vehículos Autónomos.

Nuevo enfoque de aprendizaje automático para estabilización y evitación de obstáculos en vehículos autónomos presentado por investigadores del MIT.

Investigadores del MIT han desarrollado una técnica innovadora que permite a las máquinas resolver problemas de estabilización y evitación complejos de manera más efectiva que los métodos anteriores. El nuevo enfoque de aprendizaje automático, presentado en un artículo por el autor principal Oswin So y el autor senior Chuchu Fan, permite que los aviones autónomos naveguen por terrenos peligrosos con un aumento de diez veces en la estabilidad y logren sus objetivos mientras garantizan la seguridad.

El problema de estabilización y evitación se refiere al conflicto que enfrentan los aviones autónomos al intentar alcanzar sus objetivos mientras evitan colisiones con obstáculos o la detección por radar. Muchos de los métodos de IA existentes no pueden superar este desafío, lo que dificulta su capacidad para cumplir la misión de manera segura.

Para abordar este problema, los investigadores del MIT idearon una solución de dos pasos. Primero, reformularon el problema de estabilización y evitación como un problema de optimización restringida, lo que permitió al agente llegar y estabilizarse dentro de una región objetivo designada. Al incorporar restricciones, aseguraron que el agente evitara efectivamente los obstáculos.

El segundo paso consistió en reformular el problema de optimización restringida en la forma epígrafe, una representación matemática que podría resolverse utilizando un algoritmo de aprendizaje por refuerzo profundo. Al superar las limitaciones de los enfoques de aprendizaje por refuerzo existentes, los investigadores pudieron derivar expresiones matemáticas específicas para el sistema y combinarlas con técnicas de ingeniería existentes.

Los investigadores realizaron experimentos de control con varias condiciones iniciales para probar su enfoque. Su método estabilizó todas las trayectorias mientras mantenía la seguridad, superando varios métodos de línea base. En un escenario inspirado en una película de “Top Gun”, los investigadores simularon un avión a reacción volando por un corredor estrecho cerca del suelo. Su controlador estabilizó efectivamente el avión a reacción, evitando choques o estancamientos y superando otros métodos de línea base.

Esta técnica innovadora tiene aplicaciones prometedoras en el diseño de controladores para robots altamente dinámicos que requieren garantías de seguridad y estabilidad, como drones de entrega autónomos. También podría implementarse como parte de sistemas más grandes, ayudando a los conductores a navegar por condiciones peligrosas, por ejemplo, restableciendo la estabilidad cuando un automóvil se desliza en una carretera nevada.

Los investigadores prevén proporcionar al aprendizaje por refuerzo las garantías de seguridad y estabilidad necesarias para implementar controladores en sistemas críticos para las misiones. Este enfoque representa un paso significativo hacia la consecución de ese objetivo. En el futuro, el equipo planea mejorar la técnica para tener en cuenta la incertidumbre al resolver la optimización y evaluar su rendimiento cuando se implementa en hardware, considerando las dinámicas de escenarios del mundo real.

Expertos no involucrados en la investigación han elogiado al equipo del MIT por mejorar el rendimiento del aprendizaje por refuerzo en sistemas donde la seguridad es primordial. La capacidad de generar controladores seguros para escenarios complejos, incluido un modelo de avión a reacción no lineal, tiene implicaciones de gran alcance para el campo.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

DevSecOps Integrando la seguridad en tu flujo de trabajo de DevOps

Esta extensa guía profundizará en los principios, beneficios, desafíos, casos de uso del mundo real y mejores práctic...

Ciencia de Datos

Un nuevo estudio de investigación en IA presenta AttrPrompt un generador de datos de entrenamiento LLM para un nuevo paradigma en el aprendizaje de cero disparos.

El rendimiento de los modelos de lenguaje grandes (LLMs) ha sido impresionante en muchas aplicaciones diferentes de p...

Inteligencia Artificial

¿Qué es la generación aumentada por recuperación?

Para entender el último avance en inteligencia artificial generativa, imagina un tribunal. Los jueces escuchan y deci...

Inteligencia Artificial

Grandes modelos de lenguaje RoBERTa - Un enfoque robustamente optimizado de BERT

La aparición del modelo BERT ha llevado a un progreso significativo en el procesamiento del lenguaje natural (NLP, po...

Inteligencia Artificial

Aprendizaje de Diferencia Temporal y la importancia de la exploración Una guía ilustrada

Recientemente, los algoritmos de Aprendizaje por Reforzamiento (RL) han ganado mucha atención al resolver problemas d...