paint-brush
RGB is verouderd voor AI en streamingdoor@ykanavalik
385 lezingen
385 lezingen

RGB is verouderd voor AI en streaming

door Yauheni Kanavalik7m2025/02/09
Read on Terminal Reader

Te lang; Lezen

*YUV* kan ongelooflijk nuttig zijn voor degenen die betrokken zijn bij P2P-videostreaming of het verwerken van videostreams met AI. YUV neemt de leiding en verbergt onder de motorkap een reeks complexe afwegingen die ons in staat stellen om video's te bekijken zonder vertraging, gigabytes aan data te besparen en realtime verwerking voor AI te versnellen.
featured image - RGB is verouderd voor AI en streaming
Yauheni Kanavalik HackerNoon profile picture
0-item
1-item
2-item

Nadat ik tientallen slapeloze nachten had doorgebracht met YUV- kleurcoderingsformaten, realiseerde ik me hoe weinig informatie er beschikbaar is over dit opmerkelijke formaat. Toch kan het ongelooflijk nuttig zijn voor degenen die betrokken zijn bij P2P-videostreaming of het verwerken van videostreams met AI.


Op het eerste gezicht lijken RGB en YUV misschien gewoon verschillende manieren om kleur weer te geven. Maar onder dit onderscheid schuilt een voortdurende strijd: gemak versus efficiëntie, nauwkeurigheid versus prestaties, perfecte perceptie versus compressie zonder zichtbaar verlies. Je zou kunnen aannemen dat RGB de onbetwiste koning van de kleurruimtes is. Camera's, schermen en de meeste neurale netwerken werken er immers in. In de wereld van videostreaming en -codering neemt YUV echter de leiding, en verbergt onder de motorkap een reeks complexe afwegingen die ons in staat stellen om video's zonder vertraging te bekijken, gigabytes aan data te besparen en realtimeverwerking te versnellen.


Maar wat als je deze twee werelden wilt overbruggen? Hoe gaan AI-modellen die zijn getraind op RGB om met videostreams in YUV? Waarom zijn codecs zo terughoudend om met RGB te werken? En is het mogelijk om de perfecte balans tussen deze formaten te bereiken? Hier help ik je om erachter te komen waarom RGB en YUV als twee boksers uit verschillende gewichtsklassen zijn, die elkaar in dezelfde ring van videostreaming en AI-technologie moeten ontmoeten.

RGB en YUV: wat zijn ze?

RGB- en RGBA- formaten zijn vrij eenvoudig en worden veel gebruikt in computergraphics, dus we gaan niet te diep in op de basis. Kortom, wanneer uw computer een afbeelding rendert, werkt deze met drie kanalen : Rood (R) , Groen (G) en Blauw (B) . Dit is hoe de meeste schermen werken.


RGBA voegt een extra kanaal toe — Alpha (A) — dat de transparantie regelt, wat het bijzonder nuttig maakt voor webgraphics en digitaal ontwerp. RGB geeft kleuren nauwkeurig weer zonder vervorming, maar het heeft een belangrijk nadeel: het neemt te veel ruimte in beslag. Bijvoorbeeld, een afbeelding met een resolutie van 1920 × 1080 in RGBA- formaat (met 1 byte per kanaal) neemt in beslag: 1920×1080×4 = 8294400 bytes ≈ 8.2 MB


RBG-structuur Foto door Michael Maasen op Unsplash


Gecomprimeerde formaten zoals JPEG verkleinen de bestandsgrootte, maar in de wereld van P2P-videostreaming en AI-realtimeverwerking op de machines van klanten — zoals objectherkenning, detectie van sleutelpunten en segmentatie — is dit geen haalbare optie. We moeten elk frame in realtime verzenden en analyseren, zonder compressieartefacten te introduceren of kritieke details te verliezen. Dat is waar YUV in het spel komt, en een slimmere aanpak biedt om kwaliteit, efficiëntie en prestaties in evenwicht te brengen.

Wat is YUV?

In tegenstelling tot RGB, dat kleurinformatie direct opslaat, scheidt YUV een afbeelding in luma (Y) en chroma componenten (U en V) . Deze aanpak maakt efficiënte datacompressie mogelijk zonder significant kwaliteitsverlies.


Y (Luma, helderheid) – Geeft de helderheid van de pixel weer en bepaalt hoe licht of donker deze lijkt. In wezen is dit de grijswaardenversie (zwart-wit) van de afbeelding, waarbij alle vormen en details behouden blijven.


U en V (Chroma, kleur) – Slaan kleurinformatie op, maar met een lagere precisie, aangezien het menselijk oog helderheid scherper waarneemt dan kleurnauwkeurigheid. Simpel gezegd, deze kanalen fungeren als een tweedimensionale “verschuiving” van helderheid naar verschillende kleurtinten.


Deze scheiding is de sleutel tot de effectiviteit van YUV voor videocompressie, streaming en AI-gebaseerde videoverwerking.

Waarom is YUV beter voor videostreaming?

Een van de minder voor de hand liggende maar zeer effectieve voordelen van YUV is dat een van de kanalen (Y) helemaal niet bedoeld is om kleur op te slaan. In plaats daarvan beschrijft het precies de vorm van objecten.

Wat is het verband met het menselijk zicht?

Het menselijk oog neemt beelden waar met behulp van twee soorten fotoreceptoren in het netvlies:


  • Staafcellen (~120 miljoen) – Gevoelig voor helderheid en contrast, maar niet in staat om kleur te detecteren. Ze stellen ons in staat om vormen en details te zien, zelfs bij weinig licht.

  • Kegelcellen (~6 miljoen) – Verantwoordelijk voor kleurwaarneming, maar 20 keer minder in aantal. Ze functioneren alleen bij goede lichtomstandigheden en komen in drie typen: rood, groen en blauw ( RGB , niet verrassend).


Door deze onbalans in de receptoren, geven onze hersenen voorrang aan vorm boven kleur. Als helderheid of contrast verstoord is, merken we dat meteen. Kleine kleurverschuivingen blijven echter vaak onopgemerkt.


Dit is het kernprincipe van YUV

  • Het Y- kanaal (helderheid) blijft ongewijzigd, zodat de vorm van objecten behouden blijft. Dit komt de staafjes in uw ogen ten goede.
  • De U- en V- kanalen (kleurinformatie) kunnen worden gecomprimeerd zonder dat er visueel waarneembare artefacten ontstaan en er zijn minder kegelcellen die geen verschil opmerken.


Dit betekent dat YUV, in tegenstelling tot RGB — waar alle drie de kanalen even belangrijk zijn — zijn kanalen anders behandelt op basis van menselijke perceptie. Omdat kleurgegevens (U en V) minder kritisch zijn, kunnen we de hoeveelheid verzonden gegevens verminderen zonder de waarneembare kwaliteit te verliezen.


Dit is precies hoe het Chroma Subsampling-mechanisme werkt: het optimaliseren van videocodering door kleurinformatie selectief te comprimeren, terwijl de helderheid intact blijft.

Hoe Chroma Subsampling de wereld van videostreaming redt

Chroma subsampling is een techniek om de hoeveelheid kleurgegevens in een afbeelding te verminderen. In plaats van kleur op te slaan voor elke pixel (zoals in RGB ), verlaagt YUV de resolutie van kleurkanalen terwijl de helderheid (vorm) intact blijft.


Er zijn verschillende industriestandaarden voor chroma-subsampling:

  • 4:2:2 subsampling – Elk paar pixels deelt kleurinformatie. Het oog ziet het verschil nauwelijks, maar de bestandsgrootte wordt met 33% verminderd. Deze methode wordt zelden gebruikt.

  • 4:2:0 subsampling – Kleur wordt slechts voor één van de vier pixels opgeslagen, waardoor maximale compressie wordt bereikt.


Waarom is 4:2:0 de belangrijkste standaard?

Dit formaat halveert de datagrootte zonder dat de beeldkwaliteit merkbaar achteruitgaat. Daarom is het de standaard voor bijna alle streamingdiensten en videoplatforms. Microsoft Teams verzendt bijvoorbeeld video in 4:2:0 omdat dit de beste balans biedt tussen kwaliteit en bandbreedte-efficiëntie.


In deze opstelling vertegenwoordigt één kleurwaarde vier pixels en het menselijk oog ziet het verschil niet, zelfs niet bij inzoomen, omdat de helderheid (Y) ongewijzigd blijft.


1920×1080×1.5 = 3110400 bytes ≈ 3.1 MB op één frame. Dit resulteert in een meer dan tweevoudige reductie van de datagrootte vergeleken met RGBA — zonder enig zichtbaar kwaliteitsverlies!


De afbeelding hieronder laat zien hoe het uiteindelijke frame/beeld eruit ziet met 4:2:0 chroma subsampling. Let op hoe één U vier Y beschrijft, het is 4 keer geheugenwinst!

Afbeelding van 6x4 pixels met 4:2:0 compressie. Afbeelding door Yauheni Kanavalik


Waarom is YUV zo nuttig voor AI?

In de wereld van vandaag breiden AI-toepassingen voor realtime videoverwerking zich snel uit. Neurale netwerken worden niet alleen gebruikt voor bewakingscameraanalyse en verbetering van de streamkwaliteit, maar ook voor complexere taken zoals generatieve effecten, realtime uiterlijkwijziging, objectherkenning en bewegingsregistratie.


We hebben bijvoorbeeld een virtueel make-upsysteem ontwikkeld dat lippenstift en oogschaduw op iemands gezicht aanbrengt in een videochat, en dat zo realistisch mogelijk doet. Bij dergelijke taken is precisie in vorm en beweging van cruciaal belang, terwijl kleurinformatie secundair is. U kunt uw model ook trainen om de grijswaardenafbeeldingen te begrijpen om de prestaties te verbeteren, terwijl het verkrijgen van grijswaardenafbeeldingen op de GPU veel efficiënter is als u YUV 4:2:0 als invoer neemt, omdat u alleen het eerste deel van de afbeelding hoeft te knippen om het resulterende grijswaardenkanaal te krijgen.

Belangrijkste uitdagingen bij AI-videostreaming

Vorm is belangrijker dan kleur

AI-modellen, zoals veel andere computer vision-systemen, richten zich primair op objectstructuur, vorm en randen in plaats van nauwkeurige kleurreproductie. Dit geldt voor gezichtsherkenning, pose tracking, anomaliedetectie en AR-effecten. In een bewegingsherkenningssysteem is bijvoorbeeld de pixelomtrek van een lichaam veel belangrijker dan de huidskleur.


Prestaties zijn cruciaal

Voor realtime AI moet elk frame in minder dan 20 ms worden verwerkt om een soepele framesnelheid ( 50–60 FPS ) te behouden. Hoe sneller een neuraal netwerk frames ontvangt en verwerkt, hoe natuurlijker en vloeiender de toepassing draait.


  • RGB -formaten zijn te zwaar: een 1920×1080 RGBA-frame weegt 8.2 MB , wat een enorme belasting vormt voor het geheugen en de verwerkingskracht.
  • YUV met 4:2:0 chroma subsampling reduceert onnodige gegevens in O(1) door kleuren met een lagere resolutie over te brengen, waardoor rekenkracht wordt bespaard zonder zichtbaar kwaliteitsverlies.


Geoptimaliseerde GPU-verwerking

Moderne GPU's zijn sterk geoptimaliseerd voor YUV-verwerking, wat betekent dat we met afbeeldingen kunnen werken zonder ze naar RGB te converteren. Dit elimineert onnodige berekeningen en verhoogt de verwerkingssnelheid.


Bandbreedte- en geheugenbesparing

Het verkleinen van de datagrootte is van cruciaal belang voor realtime videotransmissie en -verwerking:


  • Bij streaming wordt met YUV 4:2:0 de gegevensoverdracht met 50% verminderd, zonder merkbaar kwaliteitsverlies.
  • Bij AI kunnen modellen gecomprimeerde gegevens verwerken zonder deze op te blazen tot RGB , waardoor VRAM en rekenkracht worden bespaard.

Conclusie

Laten we eerlijk zijn: RGB lijkt de voor de hand liggende keuze. Het is de standaard in camera's, schermen en computergraphics. Maar als het aankomt op real-world videostreaming en AI-integratie, verandert RGB in een trage dinosaurus . Dan stapt YUV de ring in en biedt de perfecte balans tussen kwaliteit, snelheid en data-efficiëntie. Het slimme opslagsysteem (dat helderheid scheidt van gecomprimeerde kleur) maakt dingen mogelijk die in RGB een rekennachtmerrie zouden zijn.


  • Minder data = meer snelheid. Niemand wil dat extra megabytes realtime videoverwerking vertragen.
  • Het oog merkt de truc niet op . Onze hersenen richten zich op vorm, niet op kleine kleurverliezen — YUV maakt hier optimaal gebruik van.
  • AI geeft om FPS, niet om kleurnuances . Wanneer u slechts 16 ms per frame hebt, elimineert YUV onnodige berekeningen en bespaart het resources.
  • GPU's zijn dol op YUV . Hardwareversnelde codecs, snelle berekeningen en minimale formaatconversies: alles wat u nodig hebt voor video met hoge prestaties.

Eindoordeel

RGB is geweldig — maar niet als het gaat om realtime performance en AI. Bij videostreaming is YUV het echte werkpaard en drijft het al jaren belangrijke oplossingen aan.


Dus als je nog steeds denkt dat RGB koning is, is het tijd om te heroverwegen. Videoformaten hebben lang hun eigen regels gevolgd.

L O A D I N G
. . . comments & more!

About Author

Yauheni Kanavalik HackerNoon profile picture
Yauheni Kanavalik@ykanavalik
Solution Architect at Epam System, Entrepreneur

LABELS

DIT ARTIKEL WERD GEPRESENTEERD IN...