Autores:
(1) Xueying Mao, Facultad de Ciencias de la Computación, Universidad de Fudan, China (xymao22@[email protected]);
(2) Xiaoxiao Hu, Facultad de Ciencias de la Computación, Universidad de Fudan, China ([email protected]);
(3) Wanli Peng, Facultad de Ciencias de la Computación, Universidad de Fudan, China ([email protected]);
(4) Zhenliang Gan, Facultad de Ciencias de la Computación, Universidad de Fudan, China (zlgan23@[email protected]);
(5) Qichao Ying, Facultad de Ciencias de la Computación, Universidad de Fudan, China ([email protected]);
(6) Zhenxing Qian, Facultad de Ciencias de la Computación, Universidad de Fudan, China y autor correspondiente ([email protected]);
(7) Sheng Li, Facultad de Ciencias de la Computación, Universidad de Fudan, China ([email protected]);
(8) Xinpeng Zhang, Facultad de Ciencias de la Computación, Universidad de Fudan, China ([email protected]).
Nota del editor: Esta es la primera parte de siete de un estudio que describe el desarrollo de un nuevo método para ocultar mensajes secretos en las características semánticas de los videos, haciéndolos más seguros y resistentes a la distorsión durante el intercambio en línea. Lea el resto a continuación.
Los métodos tradicionales de esteganografía de video se basan en modificar el espacio oculto para la incrustación, mientras que nosotros proponemos un enfoque innovador que incrusta el mensaje secreto dentro de la característica semántica para la esteganografía durante el proceso de edición de video. Aunque los métodos tradicionales de esteganografía de video existentes muestran un cierto nivel de seguridad y capacidad de incrustación, carecen de la robustez adecuada contra las distorsiones comunes en las redes sociales en línea (OSN). En este artículo, presentamos una red de esteganografía de video generativa robusta de extremo a extremo (RoGVS), que logra la edición visual modificando la característica semántica de los videos para incrustar el mensaje secreto. Empleamos un escenario de intercambio de caras para mostrar los efectos de edición visual. Primero diseñamos un módulo de incrustación de mensaje secreto para ocultar de forma adaptativa el mensaje secreto en la característica semántica de los videos. Amplios experimentos muestran que el método RoGVS propuesto aplicado a conjuntos de datos de video facial demuestra su superioridad sobre las técnicas de esteganografía de video e imagen existentes en términos de robustez y capacidad.
Términos del índice : Esteganografía de video generativa, Esteganografía robusta, Modificación semántica
La esteganografía es la ciencia y la tecnología de incrustar mensajes secretos en portadores digitales naturales, como imágenes, videos, textos, etc. En general, los portadores digitales naturales se denominan “cubierta” y los medios digitales con mensajes secretos se denominan “stego”. Los métodos convencionales de esteganografía de imágenes [49, 12, 31] modifican principalmente componentes de alta frecuencia para incrustar mensajes secretos. Comúnmente utilizan metodologías como la manipulación del valor de los píxeles o la integración de mensajes secretos en la imagen de cubierta antes de ingresarla en un codificador para fines esteganográficos.
En los últimos años, con el auge de aplicaciones de software de videos cortos como TikTok, YouTube, Snapchat, etc., el video se ha convertido en un soporte adecuado para la esteganografía.
Los métodos esteganográficos de video tradicionales, que utilizan la manipulación directa de valores de píxeles [32], el mapeo de codificación [34] o la función de distorsión adaptativa [36], explotan la redundancia de datos de video para ocultar información. Sin embargo, si bien son exitosos en seguridad y capacidad de integración, estos métodos de modificación del espacio encubierto se pueden borrar fácilmente mediante operaciones comunes de posprocesamiento. Por lo tanto, son vulnerables a la mitigación de diversas distorsiones que pueden ocurrir en la transmisión de canales con pérdida.
La edición visual de los vídeos puede considerarse como el proceso de modificación de la información semántica de los objetos que se encuentran en su interior. En lugar de ocultar un mensaje secreto en un espacio oculto, incorporamos el mensaje secreto en las características semánticas de los vídeos para su edición visual. Las características semánticas avanzadas son menos susceptibles a las distorsiones, lo que hace que este método sea inherentemente robusto. Para mejorar la robustez de la esteganografía de vídeo, proponemos una red de esteganografía de vídeo generativa robusta de extremo a extremo (RoGVS), que consta de cuatro módulos, que contienen un módulo de codificación de información, un modelo de incorporación de mensajes secretos, una capa de ataque y un módulo de extracción de mensajes secretos. Para la evaluación, utilizamos la tecnología de intercambio de rostros como ejemplo para demostrar la eficacia de nuestro método, que puede ampliarse fácilmente a otras aplicaciones. Experimentos exhaustivos han demostrado que nuestro método supera las técnicas de vanguardia, logrando una robustez y capacidades de generalización encomiables.
Las principales contribuciones de nuestro trabajo son las siguientes: 1) Somos los primeros en explorar un nuevo método de esteganografía de video generativa, que modifica la característica semántica para incrustar un mensaje secreto durante la edición visual en lugar de modificar el espacio encubierto. Este marco exhibe una fuerte extensibilidad, sirviendo como un nuevo tema para el desarrollo futuro del campo de la esteganografía. 2) El método propuesto es robusto contra distorsiones comunes en la plataforma de redes sociales y el mensaje secreto se puede extraer con alta precisión. 3) Nuestro método logra una mejor seguridad para el anti-esteganálisis que otros métodos de última generación, que pueden evadir efectivamente la detección del sistema de esteganálisis.
Este artículo está disponible en arxiv bajo licencia CC 4.0.