新闻动态

位置: 首页 -> 新闻动态 -> 正文

夏文教授团队获得2025年FAST杰出研究成果奖

时间:2025-06-17 浏览次数:

数据去重(Data Deduplication)作为一种无损数据压缩技术,允许存储系统计算数据块指纹以检测相同数据块并仅维护唯一数据备份,从而大大降低存储成本,并广泛应用于大规模数据中心、备份系统、云存储等领域。然而,传统数据去重方法需要对数据块进行加密哈希计算,严重影响去重系统吞吐。新兴存储技术如持久化内存、CXL固态硬盘等使能了利用非加密哈希和字节级比对进行重复检测,降低了计算开销。然而,数据去重方法仍然需要额外维护指纹到数据块的去重元数据,引入额外的顺序性屏障与介质I/O,大大降低了数据去重性能。

在中国自然科学基金(项目号:62472127)等项目的支持下,哈尔滨工业大学(深圳)夏文教授团队首次发现数据去重映射可以与文件系统索引映射合并,形成逻辑-指纹-物理(Logical-Fingerprint-Physical,LFP) 映射,可以将去重元数据与文件系统元数据合并,通过单个 I/O 完成写入。由此,文章提出悟吉塔文件系统(GogetaFS)以充分发挥LFP的效能。GogetaFS设计提出一系列技术来管理数据和元数据,包括溢出指纹表、全局指纹表以及面向边、端、云的适配内存数据结构,实现了兼容、有效、且节省内存的数据重删方案。实验表明,GogetaFS的性能始终优于现有的去重文件系统,并且可以最大限度地减少元数据维护开销。

如下图所示的四种真实负载(Linux备份、HITSZ OS实验服务器、Mails邮件服务器以及WebVMs网络服务器)重放实验结果表明,GogetaFS比现有最先进的去重文件系统Light-Dedup快6%-32%,远远超过非去重文件系统NOVA,说明其去重元数据消除的高效性。该成果发表于系统领域顶级会议USENIX Conference on File and Storage Technologies(FAST,CCF-A)。

1 四种真实负载重放实验

尔滨工业大学(深圳)夏文教授团队立足国家战略需求和学术前沿,长期从事存储系统、操作系统、云存储、去重压缩领域研究,近年来在OSDI、FAST、USENIX ATC、ASPLOS、EuroSys等国际顶级会议发表论文80余篇,荣获教育部自然科学一等奖、湖北省科技进步一等奖等若干项,促进了国家计算机系统与计算机存储学科的发展。(审核 夏文)


请升级浏览器版本

你正在使用旧版本浏览器。请升级浏览器以获得更好的体验。