paint-brush
Conducción autónoma basada en datos: la IA necesita conjuntos de datos de entrenamiento diversos para garantizar la seguridad y la solidezpor@keymakr
299 lecturas Nueva Historia

Conducción autónoma basada en datos: la IA necesita conjuntos de datos de entrenamiento diversos para garantizar la seguridad y la solidez

por Keymakr5m2025/01/27
Read on Terminal Reader

Demasiado Largo; Para Leer

Se espera que el mercado mundial de vehículos autónomos crezca de 1.921.100 millones de dólares en 2023 a 13.632.400 millones de dólares en 2030. Este rápido crecimiento subraya la creciente importancia de los datos de capacitación de alta calidad, el aprendizaje iterativo y los sistemas de sensores robustos.
featured image - Conducción autónoma basada en datos: la IA necesita conjuntos de datos de entrenamiento diversos para garantizar la seguridad y la solidez
Keymakr HackerNoon profile picture

Las soluciones de datos de entrenamiento de IA avanzada están dando forma al panorama de la conducción autónoma.


Según un estudio reciente informe de mercado Se espera que el mercado mundial de vehículos autónomos crezca de 1.921,1 mil millones de dólares en 2023 a 13.632,4 mil millones de dólares en 2030. Este rápido crecimiento subraya la creciente importancia de los datos de capacitación de alta calidad, el aprendizaje iterativo y los sistemas de sensores robustos para satisfacer las demandas de esta industria transformadora. Profundicemos en los componentes críticos que hacen que los vehículos autónomos sean más seguros y eficientes: desde la necesidad de diversos conjuntos de datos para superar los desafíos ambientales hasta las complejidades de la integración de datos de múltiples sensores.

Por qué es importante la diversidad de datos

Las soluciones de datos de entrenamiento de IA impulsarán la evolución de la conducción autónoma al proporcionar conjuntos de datos diversos y de alta calidad necesarios para manejar escenarios complejos del mundo real. Los datos de casos extremos y la integración de múltiples sensores mejorarán la seguridad y la confiabilidad, lo que permitirá que los vehículos autónomos naveguen en condiciones inusuales y desafiantes. Además, a medida que evolucionan los diseños de los automóviles y los factores ambientales, como la moda y la apariencia de los peatones, los sistemas autónomos deben adaptar continuamente su visión por computadora a través del aprendizaje automático. El entrenamiento específico de la localización garantizará que los vehículos se adapten a las diferencias regionales, desde las leyes de tránsito hasta las condiciones ambientales. La anotación continua de datos y las actualizaciones en tiempo real permitirán que los sistemas de conducción autónoma aprendan de manera dinámica, mejorando y acelerando su implementación con el tiempo.


Crédito: Keymakr

Navegando por la ruta crítica y cómo depende del nivel de ADAS

Cuanto mayor sea el nivel de autonomía de los sistemas, más precisos y diversos serán los datos necesarios para el modelo. Sin embargo, esto depende en gran medida de los cambios en el entorno.

Esto se denomina Ruta Crítica en la industria automotriz, donde alcanzar los “nueves” (niveles de precisión como 99,9% o 99,9999%) se convierte en un objetivo crítico.


Sin embargo, alcanzar esos niveles de precisión es cada vez más difícil debido al entorno en constante cambio. Los diseños de los automóviles evolucionan, lo que requiere actualizaciones constantes de los modelos de aprendizaje automático para garantizar que puedan reconocer con precisión nuevas formas. Las carreteras, las marcas, los semáforos e incluso los detalles aparentemente menores, como un cambio en el tipo de árboles a lo largo de una carretera, también se transforman. Estos cambios requieren ajustes constantes de los algoritmos.


En esencia, no existe un conjunto de datos fijo o estático. La constante evolución del entorno hace que la anotación sea un proceso esencial y continuo. Se necesitan nuevos datos para entrenar a los modelos para que se adapten a los cambios en el mundo que los rodea. Además, los avances en materiales, tecnologías y algoritmos exigen una adaptación continua del sistema para mejorar tanto la precisión como el rendimiento.


Además de esto, hay muchos otros factores más allá de la percepción, como quién es responsable de los accidentes, las regulaciones locales y el comportamiento de los algoritmos en situaciones críticas, todo lo cual se suma a la complejidad de lograr mayores niveles de autonomía.


Como resultado, lo que hoy se considera de nivel 5 podría reclasificarse mañana como de nivel 3 debido a estándares obsoletos. Actualmente, toda la industria se enfrenta a un desafío importante: los problemas no se pueden resolver rápidamente. Abordar estos problemas requiere recursos y tiempo sustanciales. Las empresas que alguna vez creyeron que bastaría con un esfuerzo mínimo para mantener sus modelos ahora se están dando cuenta de lo rápido que evolucionan las tecnologías y los requisitos. En consecuencia, deben asignar muchos más recursos para seguir siendo competitivas y garantizar la calidad de sus soluciones.


Crédito: Keymakr

El papel de los factores ambientales en el procesamiento de datos

Ciertos factores ambientales requieren un mayor procesamiento de datos. La cantidad depende de la complejidad del entorno. Por ejemplo:

  • La lluvia, la niebla, la nieve o el hielo pueden reducir la precisión y la visibilidad de los sensores, lo que requiere un procesamiento adicional de los datos para interpretar el entorno correctamente. Los sensores lidar y basados en cámaras pueden enfrentar desafíos en estas condiciones, lo que requiere datos de mayor frecuencia para compensar los errores de los sensores o combinar las entradas de varios tipos de sensores (fusión de sensores).
  • Conducir de noche o al amanecer o al anochecer supone un reto para la visión artificial y los sistemas basados en cámaras. El sistema puede necesitar más datos de sensores infrarrojos o utilizar algoritmos para procesar imágenes de forma diferente, lo que requiere más potencia de procesamiento y datos.
  • En entornos complejos, como áreas urbanas con tráfico denso, cambios frecuentes de carril y marcas viales no estándar, se necesitan más datos para rastrear vehículos, peatones y otros objetos dinámicos.
  • El tráfico de alta densidad o los entornos con muchos obstáculos, como estacionamientos o zonas de construcción, generalmente implican más interacciones con los objetos, lo que significa más entradas de datos de radar, lidar, cámaras y otros sensores.

La integración de conjuntos de datos diversos y de alta calidad ayuda a entrenar modelos que equilibran las fortalezas y debilidades de cada sensor, lo que hace que los sistemas autónomos sean más confiables. Este enfoque integral mejora el reconocimiento de objetos, reduce los falsos positivos y optimiza el procesamiento de datos, lo que en última instancia conduce a sistemas de conducción autónoma más seguros y eficientes.

La cantidad precisa de datos adicionales necesarios varía según la tecnología del sensor y la sofisticación de los algoritmos utilizados.

Fabricante de llaves admite métodos de aprendizaje iterativo, en los que el modelo mejora progresivamente a través de múltiples ciclos de procesamiento de datos y retroalimentación. En este enfoque, a medida que se recopilan datos más diversos y de mayor calidad con el tiempo, el modelo perfecciona sus predicciones y optimiza el rendimiento. Cada iteración brinda la oportunidad de ajustar y mejorar la comprensión del modelo, lo que garantiza que se adapte a casos de uso específicos, incluidas aplicaciones complejas como soluciones para cabinas. Este proceso iterativo es esencial para manejar conjuntos de datos variables y satisfacer continuamente las expectativas cambiantes de nuestros clientes.


Crédito: Keymakr

Los desafíos de gestionar datos en tiempo real

Si bien es cierto que los vehículos no gestionan todos los datos de entrenamiento en tiempo real (ya que la recopilación de datos y el entrenamiento del modelo son tareas asincrónicas que se realizan durante el desarrollo), aún existen desafíos importantes en el procesamiento y la gestión de datos durante la operación. El principal desafío en tiempo real es procesar grandes cantidades de datos de sensores (de LiDAR, cámaras, radar, etc.) de manera rápida y precisa para tomar decisiones de conducción inmediatas. Esto requiere algoritmos altamente eficientes y potentes recursos informáticos a bordo para minimizar la latencia y garantizar la seguridad.


Otro desafío es la necesidad de que el sistema de IA del vehículo generalice su entrenamiento a situaciones nuevas e inéditas sin depender de una gestión continua de los datos. Es fundamental garantizar que los modelos entrenados previamente puedan manejar una amplia gama de escenarios del mundo real. Además, las actualizaciones de los modelos de IA deben gestionarse con cuidado; la implementación de nuevos datos y modelos de entrenamiento en los vehículos debe realizarse de forma segura y eficiente, lo que a menudo requiere actualizaciones inalámbricas que preserven la integridad del sistema. En general, la mayor parte de la gestión de datos se realiza sin conexión.


La solución es mejorar el rendimiento del modelo de visión por computadora, el hardware y los algoritmos de sincronización.


Fabricante de llaves El equipo trabajó con un desarrollador de software de vehículos autónomos líder para abordar los desafíos de mejorar la seguridad y la fiabilidad en entornos complejos del mundo real. La colaboración se centró en la anotación de datos de casos extremos, como movimientos impredecibles de peatones, cambios abruptos de carril por parte de los vehículos y navegación en condiciones climáticas extremas como niebla, nieve y lluvia intensa. El equipo sincronizó datos de múltiples sensores de cámaras, LiDAR y radar. Esto proporcionó un etiquetado completo y preciso en todas las entradas. Al integrar este conjunto de datos anotados de alta calidad, el desarrollador de vehículos autónomos logró una reducción del 18 % en los errores de detección de objetos, una mejora del 12 % en los tiempos de reacción a cambios ambientales repentinos y un aumento del 20 % en la fiabilidad de la navegación, especialmente en escenarios urbanos complejos y climáticos adversos.