作者:
(1) 毛雪英,复旦大学计算机学院 (xymao22@[email protected]);
(2)胡晓晓,复旦大学计算机学院,中国([email protected]);
(3)彭万里,复旦大学计算机学院,中国([email protected]);
(4) 甘振良,复旦大学计算机学院,中国 (zlgan23@[email protected]);
(5) 应启超,复旦大学计算机学院([email protected]);
(6)钱振兴,复旦大学计算机学院,中国,通讯作者([email protected]);
(7) 李胜,复旦大学计算机学院,中国([email protected]);
(8) 张新鹏,复旦大学计算机学院,中国 ([email protected])。
编者注:这是研究的第 1 部分(共 7 部分),介绍了一种新方法的开发,该方法可将秘密信息隐藏在视频的语义特征中,从而使其在网上共享时更加安全且不易失真。请阅读下文。
传统的视频隐写方法基于修改隐藏空间以进行嵌入,而我们提出了一种创新方法,在视频编辑过程中将秘密信息嵌入语义特征中进行隐写。虽然现有的传统视频隐写方法表现出一定的安全性和嵌入容量,但它们对在线社交网络(OSN)中常见的扭曲缺乏足够的鲁棒性。在本文中,我们介绍了一个端到端的鲁棒生成视频隐写网络(RoGVS),它通过修改视频的语义特征来嵌入秘密信息来实现视觉编辑。我们采用换脸场景来展示视觉编辑效果。我们首先设计一个秘密信息嵌入模块,自适应地将秘密信息隐藏到视频的语义特征中。大量实验表明,提出的 RoGVS 方法应用于面部视频数据集,在鲁棒性和容量方面均优于现有的视频和图像隐写技术。
索引词——生成视频隐写术、鲁棒隐写术、语义修改
隐写术是将秘密信息嵌入自然数字载体(如图像、视频、文本等)的科学和技术。通常,自然数字载体称为“载体”,带有秘密信息的数字媒体称为“隐写术”。传统的图像隐写术方法 [49, 12, 31] 主要修改高频分量以嵌入秘密信息。它们通常利用像素值操纵或将秘密信息集成到载体图像中,然后再将其输入编码器进行隐写。
过去几年,随着TikTok、YouTube、Snapchat等短视频软件应用的兴起,视频成为了隐写技术的合适载体。
传统视频隐写方法利用直接像素值操作 [32]、编码映射 [34] 或自适应失真函数 [36],利用视频数据冗余来隐藏信息。尽管这些方法在安全性和嵌入容量方面取得了成功,但它们修改隐蔽空间的方法很容易被常见的后处理操作抹去。因此,它们很容易受到有损信道传输中可能出现的各种失真的影响。
视频的视觉编辑可以看作是修改其中对象语义信息的过程。我们不是将秘密信息隐藏在隐蔽空间中,而是将秘密信息嵌入视频的语义特征中进行视觉编辑。高级语义特征不易受到扭曲,因此该方法具有内在的鲁棒性。为了提高视频隐写术的鲁棒性,我们提出了一个端到端的鲁棒生成视频隐写网络(RoGVS),它由四个模块组成,包括信息编码模块、秘密信息嵌入模型、攻击层和秘密信息提取模块。为了进行评估,我们使用换脸技术作为示例来展示我们方法的有效性,同时它可以很容易地扩展到其他应用。全面的实验表明,我们的方法超越了最先进的技术,获得了令人称赞的鲁棒性和泛化能力。
本论文的主要贡献如下:1)我们首次探索了一种新颖的生成视频隐写方法,该方法通过修改语义特征在视频编辑过程中嵌入秘密信息,而不是修改隐蔽空间。该框架具有很强的可扩展性,为隐写术领域的未来发展提供了新的课题。2)所提出的方法对社交网络平台中常见的扭曲具有很强的鲁棒性,并且可以高精度地提取秘密信息。3)我们的方法比其他最先进的方法具有更好的反隐写分析安全性,可以有效地逃避隐写分析系统的检测。