夏文教授团队在EuroSys 2025发表备份系统数据去重研究成果
数据去重(Data Deduplication)是一种高效、广泛应用的数据冗余消除技术,它识别并消除系统中的重复数据块,以此缩减数据规模,降低存储开销。由于效果显著,数据去重技术被广泛应用于各类存储系统中。然而,这种方式也带来了严重的碎片化问题:原本逻辑上连续的备份镜像,在去除重复数据块后,其物理存储布局变得高度离散,进而影响后续的访问效率。碎片化问题催生了去重碎片消除的需求。现有的去重碎片消除技术效果不尽人意...
数据去重(Data Deduplication)是一种高效、广泛应用的数据冗余消除技术,它识别并消除系统中的重复数据块,以此缩减数据规模,降低存储开销。由于效果显著,数据去重技术被广泛应用于各类存储系统中。然而,这种方式也带来了严重的碎片化问题:原本逻辑上连续的备份镜像,在去除重复数据块后,其物理存储布局变得高度离散,进而影响后续的访问效率。碎片化问题催生了去重碎片消除的需求。现有的去重碎片消除技术效果不尽人意...
文件系统(File System)是计算机系统的基石,为上层智算应用提供文件组织、数据持久化以及数据崩溃恢复能力,其使用范围覆盖每一个数据中心、个人PC以及嵌入式设备等。现代文件系统通过崩溃一致性机制来保证数据的可靠性,然而,现有的崩溃一致性机制,例如:写前日志、日志结构文件系统、软更新等,都存在着多次、少量、随机的I/O访问模式,这些访问模式造成了严重的I/O放大,带来了大量顺序I/O屏障,导致系统性能严重下降,...
NOR Flash是一种低成本、低功耗、高可靠的存储介质,广泛应用于物联网场景以及嵌入式设备中,以存储二进制程序并记录数据日志。然而,用文件系统管理NOR Flash存储介质存在资源受限的挑战,这要求文件系统在仅占有少量常数级内存的前提下支持高效数据访问。这一需求催生设备内文件系统的新架构。设备内文件系统将文件系统的数据结构,如索引、指针、位图,从内存迁移到NOR Flash上,内存仅作为读写缓存。然而,NOR Flash由于存...
数据去重(Data Deduplication)作为一种无损数据压缩技术,允许存储系统计算数据块指纹以检测相同数据块并仅维护唯一数据备份,从而大大降低存储成本,并广泛应用于大规模数据中心、备份系统、云存储等领域。然而,传统数据去重方法需要对数据块进行加密哈希计算,严重影响去重系统吞吐。新兴存储技术如持久化内存、CXL固态硬盘等使能了利用非加密哈希和字节级比对进行重复检测,降低了计算开销。然而,数据去重方法仍然需要额...
在当今数字时代,先进的机器学习技术让篡改语音内容变得更加容易,引发了人们对语音真实性的担忧。深度伪造语音技术能够高度模仿个人语音特征,生成逼真的合成语音,这对信息真实性验证构成了严峻挑战。基于深度学习的音频合成器通常通过神经网络模拟人类发声过程,利用编码器-解码器架构生成语音。然而,真实的人类语音由复杂的声学结构和多重生物参数(如性别、年龄、健康状况等)共同决定,这些因素难以被合成器完全复现,因...
人工智能语音合成技术(又称深度伪造语音技术)致力于生成或模仿目标人物的语音,以实现特定目的。随着语音合成与转换技术的飞速发展,深度伪造语音的质量已达到几乎以假乱真的程度。然而,这种技术的滥用可能带来严重的安全隐患,因此提高信息安全性成为亟待解决的问题。目前,许多研究者通过设计深度伪造语音检测模型来识别伪造语音。然而,现有方法大多依赖于对特定合成器特征痕迹的识别,这种方法在面对未知合成器生成的语...