Neural Machine Unlearning for Privacy-Preserving Information Retrieval: Novel Methods and Corrective Mechanisms PhD
面向隐私保护信息检索的神经机器遗忘:新方法与纠正机制 博士博士
该博士项目致力于解决神经信息检索(NIR)系统中的机器遗忘问题——即在保持模型性能的同时,使其能够选择性地遗忘特定数据。随着基于BERT等搜索模型的NIR系统日益普及,出于隐私法规和数据准确性考虑,迫切需要移除过时、错误或敏感信息。然而,当前的NIR模型尚缺乏在不损害检索质量的前提下有效删除数据的方法。
与分类任务不同,检索场景下的遗忘更具挑战性:因为删除一条信息可能影响大量查询-文档关系,进而扭曲搜索结果,甚至引起对已删除内容的反向关注。现有的遗忘方法在此类任务中效果不佳,因其并未针对排序和相关性评分机制进行设计。
本项目旨在:
1)开发适用于NIR的新颖遗忘方法,在移除特定数据的同时不影响保留数据上的性能;
2)构建评估框架,衡量模型在遗忘程度、有用知识保留以及排序质量维持方面的表现;
3)设计机制,用相关替代信息填补被删除内容,避免检索结果出现空白;
4)研究模型架构与数据类型如何影响遗忘过程,为未来NIR系统设计提供指导。
该项目成果将提升搜索引擎、推荐系统及其他检索应用在隐私保护、准确性和适应性方面的表现。
申请要求
中国申请者须持有四年制学士学位。学校依据《上海软科世界大学学术排名》划分录取均分要求:
- 排名前250高校:需均分72%(对应英制2:1);
- 排名251–500高校:需均分75%;
- 排名501+高校:需均分79%。
附属学院学生按所属大学排名对应以下区间考虑:前250名(67%–80%)、251–500名(70%–83%)、501+名(75%–86%)。部分商科、管理、金融或创意艺术类院校享有特殊考量(仅限体育相关专业)。未达标的申请人若具备相关学位、优异的专业课成绩或丰富工作经验,仍可能被酌情录取。
语言要求
总分6.5,且每项测试均不低于6.0
| 科目 | 总分 | 阅读 | 听力 | 口语 | 写作 |
|---|
雅思 | 6.5 | 6.0 | 6.0 | 6.0 | 6.0 |
托福总成绩为 88 分,各项测试成绩均不低于 21 分。
PTE 总成绩为 65 分,且各项子测试成绩均不低于 61 分。
| 科目 | 总分 | 阅读 | 听力 | 口语 | 写作 |
|---|
PTE | 65 | 61 | 61 | 61 | 61 |
开学与申请日期
2026
| 开学日期 | 申请开始日期 | 申请截止日期 | 申请状态 |
|---|
| 2026-01 | - | - NaN天 | - |
| 2026-04 | - | - NaN天 | - |