发布时间:2026/6/14 17:57:54
[论文学习]LLM 情境学习资料的快速精确遗忘技术:基于 In-Context Learning 与量化 K-Means 的 ERASE 方法
Fast Exact Unlearning for In-Context Learning Data for LLMs (A. Muresanu et al., ICML 2025)核心问题与动机现代大型语言模型LLM训练成本极高一旦部署后若因「被遗忘权」Right to be Forgotten法规、资料来源不可信、隐私洩露或版权问题而需移除特定训练资料会面临重大挑战。传统机器学习中的**精确遗忘Exact Unlearning**要求产生一个模型其行为完全等同于从一开始就排除该资料点后重新训练的结果即重现训练演算法在移除资料后的输出分布。在深度学习尤其是 SGD 基于权重微调中精确遗忘极其困难且昂贵。现有方法如SISASharded, Isolated, Sliced, and Aggregated虽能将遗忘成本降至原训练成本的 1/nn 为分片数但仍与完整训练成本同量级且增加分片数会降低模型效能。近似遗忘Approximate Unlearning虽较快但评估指标缺乏共识且可能无法满足法律或高安全需求。本文动机针对 LLM 的「微调阶段」Fine-tuning Data使用预训练模型适应下游任务探索是否能设计出高效的精确遗忘方案。作者观察到In-Context Learning (ICL)可替代传统 SGD 微调透过少量示范例子demonstrations引导 LLM 表现且效能接近权重微调。许多有效 ICL 例子选择策略可简化为特徵空间上的聚类Clustering例如 k-means on embeddings而聚类问题已有成熟的精确遗忘技术如 Quantized K-Means。这允许将敏感资料移至微调阶段利用预训练模型实现「模型大小与资料集大小无关」的快速精确遗忘解决深度学习遗忘的根本瓶颈。结果/成果作者提出ERASE结合 In-Context Learning 与 Quantized K-Means 的遗忘框架使用Quantized K-Means进行例子选择取代标准 k-means使单一资料点遗忘操作实现常数时间independent of dataset size and model size。在 Big-Bench Instruction Induction (BBII) 多项任务上评估ERASE 的任务效能与 SISA 等基线相当或更好同时遗忘成本大幅降低远低于重新训练或 SISA 的 O(1/n) 成本。关键实验洞见ICL Quantized K-Means 在多样性与代表性例子选择上有效维持或提升下游任务准确率。遗忘操作极快无需重新训练任何子模型只需更新聚类中心centroids且预训练模型本身不变。作者还提出新的整体成本度量考虑遗忘成本与推论成本的权衡。现有加速遗忘方法常增加推论开销例如 ensembleERASE 在此平衡上表现优异。分析与洞见多角度分析1. 技术创新将 ICL 视为学习演算法的核心开创性地将经典机器学习的精确遗忘Ginart et al. 2019 的量化聚类应用到 LLM 领域。这避开了 SGD 训练的不可逆与高维参数空间问题利用 LLM 的emergent ability情境学习能力实现「零成本」适应。2. 效能 vs. 成本权衡传统微调追求极致效能但遗忘成本高ERASE 牺牲部分潜在效能ICL 有时不如全参数微调却换来极低遗忘成本。对于需要频繁处理遗忘请求的部署情境如企业或合规应用这是重大优势。作者强调应根据预期遗忘请求频率选择学习策略。3. 边缘情况与限制假设预训练与微调资料集独立无重叠若敏感资料在预训练阶段问题仍未解决仍是开放挑战。ICL 效能依赖嵌入品质与聚类参数少样本任务或高度异质资料集可能需额外调优。Quantized K-Means 虽加速遗忘但量化可能引入轻微近似不过整体仍属 exact unlearning 框架。推论成本ICL 需要在 prompt 中放入例子token 消耗较高ensemble 方法则增加多次前向传递。作者的新度量有助量化这些 trade-off。4. 更广泛意涵隐私与合规为 LLM 部署提供可验证的「被遗忘权」实现路径可能影响未来 AI 法规。训练流程重构建议将潜在敏感资料置于微调阶段而非全混入预训练。研究启发鼓励探索其他「可遗忘友好」的学习范式如 Retrieval-Augmented Generation、Model Editing并推动统一遗忘成本评估框架。潜在风险虽然 exact但若例子选择不够 robust仍可能有间接洩露membership inference风险需结合其他防护。与相关工作比较相较知识遗忘移除特定行为而非资料点或近似方法ERASE 更严格且高效与 SISA 等相比ERASE 在遗忘速度上具压倒性优势。结论论文证明针对 LLM 微调阶段的资料利用In-Context Learning 结合 Quantized K-Means可实现高效、精确且实用的遗忘机制ERASE。这不仅解决了深度学习精确遗忘的长期难题还突显了「适配学习演算法以支援快速遗忘」的重要性。未来方向包括扩展到更多任务、处理预训练阶段遗忘、优化 ICL 效率以及制定更全面的成本-效能评估标准。文章连结arXiv: https://arxiv.org/abs/2402.00751 PDF: https://arxiv.org/pdf/2402.00751ICML 2025 版本https://openreview.net/forum?idTzNVZEsqTiHTML 版本https://arxiv.org/html/2402.00751v2

相关新闻

Paperless-ngx多语言配置终极指南:从单语困境到全球化文档管理
2026/6/14 17:57:54

Paperless-ngx多语言配置终极指南:从单语困境到全球化文档管理

Paperless-ngx多语言配置终极指南:从单语困境到全球化文档管理 【免费下载链接】paperless-ngx A community-supported supercharged document management system: scan, index and archive all your documents 项目地址: https://gitcode.com/GitHub_Trending/pa…

阅读更多
如何用Dism++实现Windows系统终极优化:免费专业的完整指南
2026/6/14 17:57:54

如何用Dism++实现Windows系统终极优化:免费专业的完整指南

如何用Dism实现Windows系统终极优化:免费专业的完整指南 【免费下载链接】Dism-Multi-language Dism Multi-language Support & BUG Report 项目地址: https://gitcode.com/gh_mirrors/di/Dism-Multi-language 你是否曾经为Windows系统越用越慢而烦恼&am…

阅读更多
如何一键解锁九大网盘真实下载地址:终极浏览器扩展使用指南
2026/6/14 17:57:54

如何一键解锁九大网盘真实下载地址:终极浏览器扩展使用指南

如何一键解锁九大网盘真实下载地址:终极浏览器扩展使用指南 【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ,支持 百度网盘 / 阿里云盘 / 中国移动云盘 /…

阅读更多
Win10BloatRemover:如何让Windows 10系统变得更轻快、更私密?
2026/6/14 18:57:55

Win10BloatRemover:如何让Windows 10系统变得更轻快、更私密?

Win10BloatRemover:如何让Windows 10系统变得更轻快、更私密? 【免费下载链接】Win10BloatRemover Configurable CLI tool to easily and aggressively debloat and tweak Windows 10 by removing preinstalled UWP apps, services and more. Originally…

阅读更多
为什么LibreDWG是CAD文件转换的终极免费方案?
2026/6/14 18:57:55

为什么LibreDWG是CAD文件转换的终极免费方案?

为什么LibreDWG是CAD文件转换的终极免费方案? 【免费下载链接】libredwg Official mirror of libredwg. With CI hooks and nightly releases. PRs ok 项目地址: https://gitcode.com/gh_mirrors/li/libredwg 你是否曾经因为收到一个DWG文件而无法打开而烦恼…

阅读更多
3步解决Cursor试用限制:免费版无限续用的终极指南
2026/6/14 18:57:55

3步解决Cursor试用限制:免费版无限续用的终极指南

3步解决Cursor试用限制:免费版无限续用的终极指南 【免费下载链接】go-cursor-help 解决Cursor在免费订阅期间出现以下提示的问题: Your request has been blocked as our system has detected suspicious activity / Youve reached your trial request limit. / To…

阅读更多
3分钟快速指南:如何用自然语言彻底解放你的GUI操作
2026/6/14 18:57:55

3分钟快速指南:如何用自然语言彻底解放你的GUI操作

3分钟快速指南:如何用自然语言彻底解放你的GUI操作 【免费下载链接】UI-TARS-desktop The Open-Source Multimodal AI Agent Stack: Connecting Cutting-Edge AI Models and Agent Infra 项目地址: https://gitcode.com/GitHub_Trending/ui/UI-TARS-desktop …

阅读更多
FAST-LIO2实战:在ROS Noetic下部署并跑通自己的数据集(避坑记录)
2026/6/14 18:57:55

FAST-LIO2实战:在ROS Noetic下部署并跑通自己的数据集(避坑记录)

FAST-LIO2实战:在ROS Noetic下部署并跑通自己的数据集(避坑记录)当第一次看到FAST-LIO2在复杂环境下依然能稳定输出厘米级定位精度时,我就被这个开源算法深深吸引了。作为一个长期从事移动机器人定位研究的工程师,我深…

阅读更多
别再纠结了!Halcon和VisionMaster到底怎么选?给工程师的实战避坑指南
2026/6/14 17:57:54

别再纠结了!Halcon和VisionMaster到底怎么选?给工程师的实战避坑指南

Halcon与VisionMaster终极对决:5个真实项目场景下的选型决策框架在机器视觉领域的技术选型会上,总有一个问题会让会议室陷入短暂的沉默:"我们该用Halcon还是VisionMaster?"这个看似简单的选择题背后,隐藏着算…

阅读更多
别再只用BERT了!用Transformers库的AutoModel,5分钟搞定文本相似度计算(附代码对比)
2026/6/14 0:57:30

别再只用BERT了!用Transformers库的AutoModel,5分钟搞定文本相似度计算(附代码对比)

超越BERT:用Transformers库高效实现文本相似度计算的三种实战方案在自然语言处理领域,文本相似度计算是信息检索、问答系统和推荐系统等应用的核心技术。传统方法如TF-IDF或Word2Vec已逐渐被基于Transformer的预训练模型所取代。Hugging Face的Transform…

阅读更多
Prompt Engineering:重构人机协作的工程化方法论
2026/6/14 0:57:30

Prompt Engineering:重构人机协作的工程化方法论

1. 项目概述:这不是“写提示词”,而是重构人机协作的底层逻辑“Prompt Engineering”这个词,这两年被讲得太多,也太轻飘。很多人把它理解成“给AI发指令的技巧”,甚至简化为“多加几个形容词”“换种说法再试一次”。我…

阅读更多
Anthropic提示层归零:模型即协议的工程实践
2026/6/14 0:57:30

Anthropic提示层归零:模型即协议的工程实践

1. 项目概述:这不是一次普通更新,而是一次架构级“蒸发”“Anthropic Just Shipped the Layer That’s Already Going to Zero”——这个标题一出来,我正在调试一个Claude调用链的终端前停了三秒。不是因为震惊,而是因为熟悉&…

阅读更多
别再只用BERT了!用Transformers库的AutoModel,5分钟搞定文本相似度计算(附代码对比)
2026/6/14 0:57:30

别再只用BERT了!用Transformers库的AutoModel,5分钟搞定文本相似度计算(附代码对比)

超越BERT:用Transformers库高效实现文本相似度计算的三种实战方案在自然语言处理领域,文本相似度计算是信息检索、问答系统和推荐系统等应用的核心技术。传统方法如TF-IDF或Word2Vec已逐渐被基于Transformer的预训练模型所取代。Hugging Face的Transform…

阅读更多
Prompt Engineering:重构人机协作的工程化方法论
2026/6/14 0:57:30

Prompt Engineering:重构人机协作的工程化方法论

1. 项目概述:这不是“写提示词”,而是重构人机协作的底层逻辑“Prompt Engineering”这个词,这两年被讲得太多,也太轻飘。很多人把它理解成“给AI发指令的技巧”,甚至简化为“多加几个形容词”“换种说法再试一次”。我…

阅读更多
Anthropic提示层归零:模型即协议的工程实践
2026/6/14 0:57:30

Anthropic提示层归零:模型即协议的工程实践

1. 项目概述:这不是一次普通更新,而是一次架构级“蒸发”“Anthropic Just Shipped the Layer That’s Already Going to Zero”——这个标题一出来,我正在调试一个Claude调用链的终端前停了三秒。不是因为震惊,而是因为熟悉&…

阅读更多
GIT修改用户名
2026/6/14 11:53:59

GIT修改用户名

在GIT中修改用户名可按以下步骤操作: 查看当前git的用户名,使用命令git config --list或git config user.name。修改git用户名,使用命令git config --global user.name "xxx(新的用户名)",将其中…

阅读更多
Win11Debloat:让你的Windows系统重获新生的终极优化工具
2026/6/13 15:45:46

Win11Debloat:让你的Windows系统重获新生的终极优化工具

Win11Debloat:让你的Windows系统重获新生的终极优化工具 【免费下载链接】Win11Debloat A simple, lightweight PowerShell script that allows you to remove pre-installed apps, disable telemetry, as well as perform various other changes to declutter and …

阅读更多
技术深度解析:m4s-converter实现原理与B站缓存视频转换最佳实践
2026/6/14 15:49:58

技术深度解析:m4s-converter实现原理与B站缓存视频转换最佳实践

技术深度解析:m4s-converter实现原理与B站缓存视频转换最佳实践 【免费下载链接】m4s-converter 一个跨平台小工具,将bilibili缓存的m4s格式音视频文件合并成mp4 项目地址: https://gitcode.com/gh_mirrors/m4/m4s-converter m4s-converter是一个…

阅读更多