NVIDIA Research gana el desafío de conducción autónoma y el premio a la innovación en CVPR.

NVIDIA Research wins autonomous driving challenge and innovation award at CVPR.

La próxima semana, NVIDIA será presentada como la ganadora del ferozmente disputado Desafío de Predicción de Ocupación 3D para el desarrollo de conducción autónoma en la Conferencia de Visión por Computadora y Reconocimiento de Patrones (CVPR), en Vancouver, Canadá.

La competencia recibió más de 400 presentaciones de casi 150 equipos en 10 regiones.

La predicción de ocupación 3D es el proceso de prever el estado de cada voxel en una escena, es decir, cada punto de datos en una cuadrícula de vista aérea en 3D. Los voxels pueden identificarse como libres, ocupados o desconocidos.

Crítica para el desarrollo de sistemas de conducción autónoma seguros y robustos, la predicción de cuadrícula de ocupación 3D proporciona información a las pilas de planificación y control de vehículos autónomos (VA) utilizando redes neuronales convolucionales y modelos transformadores de última generación, los cuales son habilitados por la plataforma NVIDIA DRIVE.

“La solución ganadora de NVIDIA presenta dos importantes avances de VA”, dijo Zhiding Yu, científico investigador senior en aprendizaje y percepción en NVIDIA. “Demuestra un diseño de modelo de última generación que proporciona una excelente percepción de vista aérea. También muestra la efectividad de los modelos de fundación visual con hasta 1 billón de parámetros y preentrenamiento a gran escala en predicción de ocupación 3D”.

La percepción para la conducción autónoma ha evolucionado en los últimos años desde el manejo de tareas 2D, como la detección de objetos o espacios libres en imágenes, hasta el razonamiento sobre el mundo en 3D con múltiples imágenes de entrada.

Esto proporciona ahora una representación flexible y precisa de objetos en escenas de tráfico complejas, lo que es “crítico para lograr los requisitos de percepción de seguridad para la conducción autónoma”, según Jose Alvarez, director de investigación aplicada de VA y científico distinguido en NVIDIA.

Yu presentará el trabajo galardonado del equipo de investigación de NVIDIA en el taller de conducción autónoma de extremo a extremo de CVPR el domingo 18 de junio a las 10:20 a.m. PT, así como en el taller de conducción autónoma centrado en la visión el lunes 19 de junio a las 4:00 p.m. PT.

Además de ganar el primer lugar en el desafío, NVIDIA recibirá en el evento un Premio a la Innovación, reconociendo sus “nuevas ideas sobre el desarrollo de módulos de transformación de vista”, con un “rendimiento sustancialmente mejorado” en comparación con enfoques anteriores, según el comité del taller de CVPR.

Lea el informe técnico de NVIDIA sobre la presentación.

Vehículos más seguros con la predicción de ocupación 3D

Mientras que la detección de objetos 3D tradicional, que consiste en detectar y representar objetos en una escena, a menudo usando cajas delimitadoras 3D, es una tarea básica en la percepción de VA, tiene sus limitaciones. Por ejemplo, carece de expresividad, lo que significa que las cajas delimitadoras podrían no representar suficiente información del mundo real. También requiere definir taxonomías y verdades fundamentales para todos los objetos posibles, incluso aquellos que rara vez se ven en el mundo real, como los peligros en la carretera que pueden haber caído de un camión.

En contraste, la predicción de ocupación 3D proporciona información detallada sobre el mundo a la pila de planificación de un vehículo autónomo, que es necesaria para la conducción autónoma de extremo a extremo.

Los vehículos definidos por software pueden actualizarse continuamente con nuevos desarrollos que se comprueban y validan con el tiempo. Las actualizaciones de software de última generación que evolucionan a partir de iniciativas de investigación, como las reconocidas en CVPR, están permitiendo nuevas funciones y capacidades de conducción más seguras.

La plataforma NVIDIA DRIVE ofrece un camino hacia la producción para los fabricantes de automóviles, proporcionando hardware y software de pila completa para el desarrollo seguro y protegido de VA, desde el automóvil hasta el centro de datos.

Más sobre el Desafío CVPR

El Desafío de Predicción de Ocupación 3D en CVPR requería que los participantes desarrollaran algoritmos que solo usaran entrada de cámara durante la inferencia. Los participantes podían utilizar conjuntos de datos y modelos de código abierto, lo que facilitaba la exploración de algoritmos controlados por datos y modelos a gran escala. Los organizadores proporcionaron un sandbox de referencia para los últimos algoritmos de predicción de ocupación 3D de última generación en escenarios del mundo real.

NVIDIA en CVPR

NVIDIA presenta casi 30 artículos y presentaciones en CVPR. Los expertos que hablarán sobre la conducción autónoma incluyen:

  • Jose Alvarez sobre los desafíos emergentes para la percepción 3D en VA durante el taller de conducción autónoma de extremo a extremo: Taller de tareas y desafíos emergentes; y sobre la optimización de modelos profundos grandes para la inferencia en tiempo real en el Taller de visión integrada.
  • Nikolai Smolyanskiy, director de aprendizaje profundo en NVIDIA, sobre la predicción de tráfico en tiempo real para VA durante el taller de conducción autónoma de extremo a extremo: Percepción, Predicción, Planificación y Simulación.
  • Robin Jenkin, ingeniero distinguido en NVIDIA, sobre la calidad de imagen en cámaras de ojo de pez en el taller OmniCV, celebrado en conjunto con CVPR.
  • Xinshuo Weng, científico investigador en investigación de VA en NVIDIA, sobre soluciones de visión para la conducción autónoma durante el taller de conducción autónoma centrado en la visión.

Ve otras charlas en la agenda y aprende más sobre NVIDIA en CVPR, que se lleva a cabo del 18 al 22 de junio.

Imagen destacada cortesía de OccNet y Occ3D.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Investigadores de Corea del Sur proponen VITS2 un avance en los modelos de síntesis de voz de una sola etapa para una mayor naturalidad y eficiencia.

El artículo presenta VITS2, un modelo de síntesis de texto a voz de una sola etapa que sintetiza un habla más natural...

Inteligencia Artificial

¿Podemos transformar texto en gráficos vectoriales científicos? Este artículo de IA presenta AutomaTikZ y explica el poder de TikZ

Los últimos avances en la generación de texto a imagen han hecho posible la creación de gráficos detallados a partir ...

Inteligencia Artificial

El papel de los grafos de conocimiento empresarial en LLMs.

Introducción Los Grandes Modelos de Lenguaje (LLMs) y la Inteligencia Artificial Generativa representan un avance tra...

Inteligencia Artificial

Este artículo de IA de China propone HQTrack un marco de IA para rastrear cualquier cosa de alta calidad en videos

El seguimiento visual de objetos es la base de numerosos subcampos dentro de la visión por computadora, incluyendo la...