paint-brush
Datadrevet autonom kørsel: AI har brug for forskellige træningsdatasæt for at sikre sikkerhed og robusthedved@keymakr
329 aflæsninger
329 aflæsninger

Datadrevet autonom kørsel: AI har brug for forskellige træningsdatasæt for at sikre sikkerhed og robusthed

ved Keymakr5m2025/01/27
Read on Terminal Reader

For langt; At læse

Det globale marked for autonome køretøjer forventes at vokse fra 1.921,1 milliarder USD i 2023 til 13.632,4 milliarder USD i 2030. Denne hurtige vækst understreger den stigende betydning af træningsdata af høj kvalitet, iterativ læring og robuste sensorsystemer.
featured image - Datadrevet autonom kørsel: AI har brug for forskellige træningsdatasæt for at sikre sikkerhed og robusthed
Keymakr HackerNoon profile picture

Avancerede AI-træningsdataløsninger former landskabet for autonom kørsel.


Ifølge en nylig markedsrapport , forventes det globale marked for autonome køretøjer at vokse fra 1.921,1 milliarder USD i 2023 til 13.632,4 milliarder USD i 2030. Denne hurtige vækst understreger den stigende betydning af træningsdata af høj kvalitet, iterativ læring og robuste sensorsystemer for at imødekomme kravene i denne transformerende industri. Lad os dykke ned i de kritiske komponenter, der gør selvkørende køretøjer sikrere og mere effektive: fra nødvendigheden af forskellige datasæt for at overvinde miljømæssige udfordringer til kompleksiteten ved at integrere multisensordata.

Hvorfor datadiversitet er vigtig

AI-træningsdataløsninger vil drive udviklingen af autonom kørsel ved at levere forskellige datasæt af høj kvalitet, der er nødvendige for at håndtere komplekse scenarier i den virkelige verden. Edge case-data og multi-sensor integration vil øge sikkerheden og pålideligheden, hvilket gør AV'er i stand til at navigere i sjældne og udfordrende forhold. Derudover, efterhånden som bildesign og miljøfaktorer, såsom fodgængermode og udseende, udvikler sig, skal autonome systemer løbende tilpasse deres computersyn gennem maskinlæring. Lokaliseringsspecifik træning vil sikre, at køretøjer tilpasser sig regionale forskelle, fra færdselslove til miljøforhold. Kontinuerlige dataannoteringer og realtidsopdateringer vil gøre det muligt for selvkørende systemer at lære dynamisk, hvilket forbedrer og accelererer deres implementering over tid.


Kredit: Keymakr

Navigering på den kritiske vej, og hvordan den afhænger af ADAS-niveauet

Jo højere niveauet af autonome systemer er, desto mere nøjagtige og forskelligartede er de data, der kræves til modellen. Dette er dog meget afhængig af ændringer i miljøet.

Dette kaldes den kritiske vej i bilindustrien, hvor opnåelse af "nierne" (nøjagtighedsniveauer såsom 99,9% eller 99,9999%) bliver et kritisk mål.


Men at nå sådanne niveauer af nøjagtighed bliver stadig mere udfordrende på grund af det konstant skiftende miljø. Bildesign udvikler sig, hvilket nødvendiggør konstante opdateringer af maskinlæringsmodeller for at sikre, at de nøjagtigt kan genkende nye former. Veje, afmærkninger, trafiklys og endda tilsyneladende mindre detaljer, såsom en ændring i trætypen langs en vej, forvandles også. Disse ændringer kræver løbende justeringer af algoritmerne.


I bund og grund er der ikke noget fast eller statisk datasæt. Den konstante udvikling af miljøet gør annotering til en væsentlig og kontinuerlig proces. Nye data er nødvendige for at træne modeller til at tilpasse sig ændringer i verden omkring dem. Desuden kræver fremskridt inden for materialer, teknologier og algoritmer kontinuerlig systemtilpasning for at forbedre både nøjagtighed og ydeevne.


Udover dette er der mange andre faktorer, der ligger uden for opfattelsen, såsom hvem der er ansvarlig og ansvarlig for ulykker, lokale regler og algoritmeadfærd i kritiske situationer, som alle bidrager til kompleksiteten i at opnå højere niveauer af autonomi.


Som følge heraf kan det, der betragtes som niveau 5 i dag, blive omklassificeret til niveau 3 i morgen på grund af forældede standarder. Hele industrien står i øjeblikket over for en betydelig udfordring: problemer kan ikke løses hurtigt. At løse disse problemer kræver betydelige ressourcer og tid. Virksomheder, der engang troede, at minimal indsats ville være tilstrækkelig til at vedligeholde deres modeller, indser nu, hvor hurtigt teknologier og krav udvikler sig. De skal derfor afsætte langt flere ressourcer for at forblive konkurrencedygtige og sikre kvaliteten af deres løsninger.


Kredit: Keymakr

Miljøfaktorers rolle i behandling af data

Visse miljøfaktorer kræver mere databehandling. Mængden afhænger af miljøets kompleksitet. For eksempel:

  • Regn, tåge, sne eller is kan reducere sensorens nøjagtighed og synlighed, hvilket kræver yderligere databehandling for at fortolke miljøet korrekt. Lidar- og kamerabaserede sensorer kan stå over for udfordringer under disse forhold, idet de kræver højere frekvensdata for at kompensere for sensorfejl eller for at kombinere input fra flere sensortyper (sensorfusion).
  • Kørsel om natten eller ved daggry/skumring udfordrer computersyn og kamerabaserede systemer. Systemet kan have brug for flere data fra infrarøde sensorer eller bruge algoritmer til at behandle billeder anderledes, hvilket kræver mere processorkraft og data.
  • I komplekse miljøer, såsom byområder med tæt trafik, hyppige vognbaneskift og ikke-standard vejafmærkning, er der behov for flere data for at spore køretøjer, fodgængere og andre dynamiske objekter.
  • Trafik med høj tæthed eller miljøer med mange forhindringer, såsom parkeringspladser eller byggezoner, involverer typisk flere interaktioner med objekter, hvilket betyder flere datainput fra radar, lidar, kameraer og andre sensorer.

Integrering af forskellige datasæt af høj kvalitet hjælper med at træne modeller, der balancerer styrkerne og svaghederne ved hver sensor, hvilket gør autonome systemer mere pålidelige. Denne omfattende tilgang forbedrer genkendelse af objekter, reducerer falske positiver og optimerer databehandling, hvilket i sidste ende fører til sikrere og mere effektive autonome køresystemer.

Den præcise mængde yderligere data, der kræves, varierer afhængigt af sensorteknologi og sofistikeringen af de anvendte algoritmer.

Keymakr understøtter iterative læringsmetoder, hvor modellen forbedres gradvist gennem flere cyklusser af databehandling og feedback. I denne tilgang forbedrer modellen sine forudsigelser og optimerer ydeevnen, efterhånden som mere forskelligartede data af højere kvalitet indsamles over tid. Hver iteration giver mulighed for at finjustere og forbedre modellens forståelse, hvilket sikrer, at den tilpasser sig specifikke brugssituationer, herunder komplekse applikationer som løsninger i kabinen. Denne iterative proces er essentiel for håndtering af varierende datasæt og løbende opfyldelse af vores kunders skiftende forventninger.


Kredit: Keymakr

Udfordringerne ved at administrere data i realtid

Selvom det er rigtigt, at køretøjer ikke administrerer alle træningsdata i realtid - da dataindsamling og modeltræning er asynkrone opgaver, der udføres under udvikling - er der stadig betydelige udfordringer med at behandle og administrere data under drift. Den primære udfordring i realtid er at behandle enorme mængder sensordata (fra LiDAR, kameraer, radar osv.) hurtigt og præcist for at træffe øjeblikkelige kørselsbeslutninger. Dette kræver meget effektive algoritmer og kraftfulde indbyggede computerressourcer for at minimere latens og sikre sikkerhed.


En anden udfordring er behovet for, at køretøjets AI-system generaliserer fra dets træning til nye, usete situationer uden at være afhængig af kontinuerlig datastyring. Det er afgørende at sikre, at de fortrænede modeller kan håndtere en bred vifte af scenarier i den virkelige verden. Derudover skal opdateringer til AI-modellerne administreres omhyggeligt; implementering af nye træningsdata og modeller til køretøjer skal ske sikkert og effektivt, hvilket ofte kræver trådløse opdateringer, der bevarer systemets integritet. Generelt foregår hovedparten af datahåndtering offline.


Løsningen er at forbedre ydeevnen af computervisionsmodellen, hardwaren og synkroniseringsalgoritmerne.


Keymakr teamet arbejdede med en førende AV-softwareudvikler for at løse udfordringerne med at forbedre sikkerheden og pålideligheden i komplekse miljøer i den virkelige verden. Samarbejdet fokuserede på annotering af kantcasedata, såsom uforudsigelige fodgængerbevægelser, pludselige vognbaneskift af køretøjer og navigation under ekstreme vejrforhold som tåge, sne og kraftig regn. Holdet synkroniserede multisensordata fra kameraer, LiDAR og radar. Det gav omfattende og præcis mærkning på tværs af alle input. Ved at integrere dette højkvalitets annoterede datasæt opnåede AV-udvikleren en 18 % reduktion i objektdetekteringsfejl, en 12 % forbedring i reaktionstider på pludselige miljøændringer og en 20 % stigning i navigationspålidelighed, især i komplekse byområder og ugunstigt vejr. scenarier.