Autors:
(1) Xueying Mao, Escola d'Informàtica, Universitat de Fudan, Xina (xymao22@[email protected]);
(2) Xiaoxiao Hu, Escola d'Informàtica, Universitat de Fudan, Xina ([email protected]);
(3) Wanli Peng, Escola d'Informàtica, Universitat de Fudan, Xina ([email protected]);
(4) Zhenliang Gan, Escola d'Informàtica, Universitat de Fudan, Xina (zlgan23@[email protected]);
(5) Qichao Ying, Escola d'Informàtica, Universitat de Fudan, Xina ([email protected]);
(6) Zhenxing Qian, Escola d'Informàtica, Universitat de Fudan, Xina i autor corresponent ([email protected]);
(7) Sheng Li, Escola d'Informàtica, Universitat de Fudan, Xina ([email protected]);
(8) Xinpeng Zhang, Escola d'Informàtica, Universitat de Fudan, Xina ([email protected]).
Nota de l'editor: aquesta és la part 1 de 7 d'un estudi que descriu el desenvolupament d'un nou mètode per amagar missatges secrets a les característiques semàntiques dels vídeos, fent-lo més segur i resistent a la distorsió durant l'ús compartit en línia. Llegeix la resta a continuació.
Els mètodes tradicionals d'esteganografia de vídeo es basen a modificar l'espai encobert per a la incrustació, mentre que proposem un enfocament innovador que incorpora un missatge secret dins de la funció semàntica de l'esteganografia durant el procés d'edició de vídeo. Tot i que els mètodes tradicionals d'esteganografia de vídeo existents mostren un cert nivell de seguretat i capacitat d'inserció, no tenen una robustesa adequada contra les distorsions habituals a les xarxes socials en línia (OSN). En aquest article, introduïm una xarxa d'esteganografia de vídeo generativa (RoGVS) robusta d'extrem a extrem, que aconsegueix l'edició visual modificant la característica semàntica dels vídeos per incrustar missatges secrets. Utilitzem un escenari d'intercanvi de cares per mostrar els efectes d'edició visual. Primer dissenyem un mòdul d'inserció de missatges secrets per amagar de manera adaptativa el missatge secret a la funció semàntica dels vídeos. Experiments extensos mostren que el mètode RoGVS proposat aplicat a conjunts de dades de vídeo facial demostren la seva superioritat sobre les tècniques d'esteganografia de vídeo i imatge existents tant en termes de robustesa com de capacitat.
Termes de l'índex — Esteganografia de vídeo generativa, Esteganografia robusta, Modificació semàntica
L'esteganografia és la ciència i la tecnologia d'incrustar missatges secrets en suports digitals naturals, com ara imatge, vídeo, text, etc. Generalment, els suports digitals naturals s'anomenen "coberta" i els mitjans digitals amb missatge secret s'anomenen "stego". Els mètodes convencionals d'esteganografia d'imatge [49, 12, 31] modifiquen principalment components d'alta freqüència per incrustar missatges secrets. Sovint utilitzen metodologies com la manipulació del valor de píxels o la integració de missatges secrets a la imatge de portada abans d'introduir-lo en un codificador amb finalitats esteganogràfics.
En els darrers anys, amb l'augment d'aplicacions de programari de vídeo curt com TikTok, YouTube, Snapchat, etc., el vídeo s'ha convertit en un suport adequat per a l'esteganografia.
Els mètodes tradicionals esteganogràfics de vídeo, que utilitzen la manipulació directa del valor de píxels [32], la codificació de mapes [34] o la funció de distorsió adaptativa [36], exploten la redundància de dades de vídeo per amagar la informació. No obstant això, tot i que tenen èxit en la seguretat i la capacitat d'inserció, aquests mètodes per modificar l'espai encobert es poden esborrar fàcilment mitjançant operacions de postprocessament habituals. Per tant, són vulnerables a mitigar diverses distorsions que es poden produir en la transmissió de canals amb pèrdues.
L'edició visual dels vídeos es pot veure com el procés de modificació de la informació semàntica dels objectes dins d'ells. En lloc d'amagar el missatge secret a l'espai encobert, incrutem el missatge secret a la funció semàntica dels vídeos per a l'edició visual. La característica semàntica avançada és menys susceptible a les distorsions, cosa que fa que aquest mètode sigui inherentment robust. Per tal de millorar la robustesa de l'esteganografia de vídeo, proposem una xarxa d'esteganografia de vídeo generativa (RoGVS) robusta d'extrem a extrem, que consta de quatre mòduls, que conté un mòdul de codificació d'informació, un model d'inserció de missatges secrets, una capa d'atac i una extracció de missatges secrets. mòdul. Per a l'avaluació, utilitzem la tecnologia d'intercanvi de cares com a exemple per mostrar l'eficàcia del nostre mètode, mentre que es pot estendre fàcilment a altres aplicacions. Experiments exhaustius han demostrat que el nostre mètode supera les tècniques d'última generació, aconseguint una robustesa i capacitats de generalització lloables.
Les principals contribucions del nostre treball són les següents: 1) Som els primers a explorar un nou mètode d'esteganografia de vídeo generativa, que modifica la característica semàntica per incrustar missatges secrets durant l'edició visual en lloc de modificar l'espai encobert. Aquest marc presenta una forta extensibilitat, servint com a nou tema per al desenvolupament futur del camp de l'esteganografia. 2) El mètode proposat és robust contra les distorsions comunes a la plataforma de xarxes socials i el missatge secret es pot extreure amb gran precisió. 3) El nostre mètode aconsegueix una millor seguretat per a l'anti-esteganàlisi que altres mètodes d'última generació, que poden evadir eficaçment la detecció del sistema d'esteganàlisi.
Aquest document està disponible a arxiv sota la llicència CC 4.0.