新闻动态

位置: 首页 -> 新闻动态 -> 正文

廖清教授课题组在数据挖掘领域取得进展

时间:2025-05-09 浏览次数:

联邦学习(Federated Learning, FL)作为一种隐私保护的分布式学习范式,允许客户端在不共享本地数据的情况下协作训练全局模型,广泛应用于金融、物联网和医疗等领域。然而,传统联邦学习假设客户端数据的标签分布是静态的,而真实场景中客户端数据往往随时间持续出现新类别(如移动设备不断采集新数据),这催生了联邦类增量学习(Federated Class Incremental Learning, FCIL)的新需求。FCIL要求模型在客户端持续学习新类别的同时,避免遗忘旧类别知识(即灾难性遗忘),同时还需应对客户端间新增数据的非独立同分布问题(如不同客户端新增类别可能重叠或差异显著)。

在广东省科技重大专项(项目号:2019B030302002)等项目的支持下,哈尔滨工业大学(深圳)廖清教授团队提出了一种名为CGoFed的联邦类增量学习框架,旨在解决动态数据场景下模型稳定性(抗遗忘)与可塑性(适应新任务)的平衡问题,以及客户端增量数据标签分布不一致的挑战。CGoFed通过松弛约束梯度更新动态调整梯度方向约束强度,在训练初期保持新任务梯度方向与旧任务梯度空间的严格正交投影以维护历史任务知识,在训练后期逐步放宽约束以提升新任务学习能力,并引入遗忘阈值触发约束重置机制;同时设计跨任务梯度正则化模块,利用服务器端计算任务间表示相似度,选择相关性最高的历史模型进行知识融合,缓解非独立同分布带来的模型漂移。

如下图所示的Non-IID场景实验结果表明,在极端Non-IID场景(Dirichletβ=0.05)中,CGoFed平均准确率较最优基线(FedLwF)提升21.89%,AF低至0.0552,展现其对Non-IID场景的强鲁棒性。成果发表于领域顶级期刊IEEE Transactions on Knowledge and Data Engineering (IEEE TKDE,SCI,JCR Q1,中科院1区,IF 8.9)。

图1 Non-IID场景实验结果

哈尔滨工业大学(深圳)廖清教授团队立足国家战略需求和学术前沿,长期从事数据挖掘、信息安全、人工智能领域研究,近年来在IEEE TCYB, IEEE TNNLS, IEEE TKDE, NeurIPS等国际顶级期刊和会议发表论文逾百篇,荣获国家二等奖及省部级一等奖5项,促进了国家人工智能与计算机领域学科的发展。(审核  廖清)

请升级浏览器版本

你正在使用旧版本浏览器。请升级浏览器以获得更好的体验。