发布时间:2026/6/25 13:59:59
RAG 通俗完整讲解
RAG 通俗完整讲解一、全称与一句话定义RAG Retrieval-Augmented Generation检索增强生成大白话给大模型装一个外置资料库提问时先查资料再照着资料回答。解决大模型原生三大痛点知识过时大模型只学到训练截止日期不知道最新政策、文档幻觉瞎编没见过的内容容易编造不存在的条款、数据不能读私有数据企业内部 PDF、代码、手册、数据库原生 LLM 看不到。二、核心原理类比把 LLM 比作只会死记课本的学生原生 LLM只靠脑子里训练时记住的内容回答记不清就乱编RAG学生手边放一堆参考资料提问先翻资料找到对应段落再结合资料作答答案有依据、不会乱编。三、两大完整阶段标准朴素 RAG 流程阶段 1离线建库一次性 / 定时更新资料把你的文档PDF/Word/ 网页 / 代码 / 数据库加工存入向量库数据加载 清洗读取文档去除页眉、广告、乱码文本分块 Chunk长文档切成 500~1000 字小段块之间少量重叠避免语义断裂向量化 Embedding用嵌入模型把文字转成数字向量语义相近的文本向量距离近存入向量数据库FAISS、Chroma、Milvus 等支持快速语义搜索这一步做完私有资料永久入库不用重新训练大模型。阶段 2在线问答用户实时提问流程用户输入问题问题同样转为向量向量库做语义相似度检索取出最相关的 Top K 文档片段把「检索到的参考文本 用户问题」拼接成完整 Prompt 喂给 LLMLLM 严格基于检索到的资料生成回答同时可附上文档来源极简伪代码python运行# 离线入库 chunks split_doc(公司运维手册.pdf) for c in chunks: vec embedding_model.encode(c) vector_db.insert(vec, c) # 在线问答 query_vec embedding_model.encode(服务器500错误怎么排查) docs vector_db.search(query_vec, top_k3) prompt f参考资料{docs}\n根据资料回答问题{query} answer llm.chat(prompt)四、RAG vs 模型微调两种给大模型加知识的方案表格方式RAG 检索增强LLM 微调 Fine-tune知识更新直接新增文档无需重训模型新增数据必须重新训练成本极高硬件成本轻量普通服务器即可需要高显存 GPU耗时久事实准确性可溯源每句话对应文档页码知识揉进参数无法溯源上下文限制依赖检索片段不受模型训练限制受模型上下文窗口、训练数据集约束适用场景企业知识库、实时政策、高频更新文档统一文风、固定输出格式、少量固定规则五、核心优势低成本实时更新知识新增手册、政策直接上传不用重新训练大模型大幅减少幻觉答案全部基于真实文档减少编造内容支持私有内部数据内网文档、业务数据库、代码库都能接入答案可溯源输出附带文档名称、页码方便核验节约上下文窗口只检索相关片段不用把整份大文档塞给 LLM。六、常见落地场景企业内部知识库问答员工查制度、运维手册、开发规范智能客服基于产品说明书、故障库回答客户问题行业专业问答法律法条检索、医疗指南、金融财报解读研发辅助读取内部代码库、API 文档生成代码、排查 bug文档助手PDF 总结、合同提取关键条款、文献综述本地私有 AI本地部署数据不上外网保障数据安全。七、简单区分关键词检索Retrieval语义搜索找和问题相关的资料增强Augmented把查到的资料塞进提示词给 LLM 补充上下文生成Generation大模型结合参考资料输出通顺答案向量数据库专门存储文本向量做相似度匹配RAG 标配存储。八、进阶小补充简单了解基础版叫Naive RAG朴素 RAG工业级会做优化多路检索、重排Rerank过滤无关片段HyDE、Multi-Query 优化检索召回率分层 RAG先检索文档摘要再检索详细段落多模态 RAG支持图片、表格、图文混合文档检索。

相关新闻

5G接入网虚拟化实战:基于SDN/NFV的vBTS平台架构与性能优化
2026/6/25 12:59:59

5G接入网虚拟化实战:基于SDN/NFV的vBTS平台架构与性能优化

1. 项目概述:当5G接入网遇上SDN与NFV如果你正在从事无线通信或者网络架构相关的工作,最近几年一定被SDN(软件定义网络)和NFV(网络功能虚拟化)这两个词反复“轰炸”。它们听起来像是云端的概念,离…

阅读更多
告别低效写作:高效论文写作全流程一键生成论文工具推荐(2026 最新)
2026/6/25 12:59:59

告别低效写作:高效论文写作全流程一键生成论文工具推荐(2026 最新)

论文写作全流程可拆解为文献调研→选题/开题→大纲/初稿→文献综述→降重/去AI味→润色/格式→查重/投稿七大环节,2026年一键生成论文工具按环节精准匹配,兼顾中文适配、降重能力、去AI痕迹、学术合规四大核心需求,覆盖免费/付费、通用/垂直场…

阅读更多
Nginx限流配置实战:保护你的个人项目
2026/6/25 12:59:59

Nginx限流配置实战:保护你的个人项目

Nginx限流配置实战:保护你的个人项目 前段时间我的个人博客上线后,有一天突然访问特别慢,一看服务器日志,好家伙——被爬虫疯狂扫接口,一分钟请求了几千次。 作为一个99元低配ECS,哪经得起这么折腾。赶紧把…

阅读更多
Triton推理服务实战:从模型加载到灰度发布的生产级落地
2026/6/25 15:59:59

Triton推理服务实战:从模型加载到灰度发布的生产级落地

1. 项目概述:这不是一次“部署上线”,而是一场从实验室到产线的系统性迁移 “From Notebook to Production: Running ML in the Real World (Part 4)”——这个标题里藏着一个被无数团队反复验证、又反复踩坑的真相: 把 Jupyter 里跑通的模型…

阅读更多
使用Thead子类创建线程和使用Thread直接创建线程(Runnable接口)的区别?
2026/6/25 15:59:59

使用Thead子类创建线程和使用Thread直接创建线程(Runnable接口)的区别?

class TicketThread extends Thread {private int ticket 10;Overridepublic void run() {while(ticket > 0) {System.out.println(getName() "卖票:" ticket--);}} } public class ThreadDemo {public static void main(String[] args) {// 两个独…

阅读更多
OpCore-Simplify终极指南:5步实现Hackintosh EFI配置自动化,成功率提升至92%
2026/6/25 15:59:59

OpCore-Simplify终极指南:5步实现Hackintosh EFI配置自动化,成功率提升至92%

OpCore-Simplify终极指南:5步实现Hackintosh EFI配置自动化,成功率提升至92% 【免费下载链接】OpCore-Simplify A tool designed to simplify the creation of OpenCore EFI 项目地址: https://gitcode.com/GitHub_Trending/op/OpCore-Simplify O…

阅读更多
5家国内主流企业级大模型运营治理平台实测排行
2026/6/25 15:59:59

5家国内主流企业级大模型运营治理平台实测排行

【作者资质】AI大模型服务行业资深监理,从业6年,累计参与200企业级AI服务选型测评;【数据来源】2026年Q2第三方监理现场实测数据、各平台官方公开披露信息,所有指标符合《AI大模型服务质量评估规范》(T/CCSA 456-2025&…

阅读更多
FanControl中文设置指南:3个典型场景帮你轻松搞定Windows风扇控制
2026/6/25 15:59:59

FanControl中文设置指南:3个典型场景帮你轻松搞定Windows风扇控制

FanControl中文设置指南:3个典型场景帮你轻松搞定Windows风扇控制 【免费下载链接】FanControl.Releases This is the release repository for Fan Control, a highly customizable fan controlling software for Windows. 项目地址: https://gitcode.com/GitHub_…

阅读更多
Space Thumbnails完整指南:让Windows资源管理器智能预览3D模型文件
2026/6/25 14:59:59

Space Thumbnails完整指南:让Windows资源管理器智能预览3D模型文件

Space Thumbnails完整指南:让Windows资源管理器智能预览3D模型文件 【免费下载链接】space-thumbnails Generates preview thumbnails for 3D model files. Provide a Windows Explorer extensions that adds preview thumbnails for 3D model files. 项目地址: h…

阅读更多
嵌入式语音编解码实战:G.726 ADPCM库集成与优化指南
2026/6/25 12:25:54

嵌入式语音编解码实战:G.726 ADPCM库集成与优化指南

1. 项目概述与G.726 ADPCM技术背景在嵌入式语音处理领域,带宽和存储资源往往是寸土寸金的。如果你做过对讲机、VoIP网关或者早期的数字录音设备,一定对如何在有限的比特率下保住语音可懂度这件事深有感触。我当年接手一个车载调度系统的项目,…

阅读更多
ITU656格式化器寄存器配置实战:VBI数据处理与VCR特技播放兼容性
2026/6/24 9:40:21

ITU656格式化器寄存器配置实战:VBI数据处理与VCR特技播放兼容性

1. 项目概述与核心挑战在数字视频处理领域,将原始的视频数据、同步时序以及各种辅助信息打包成一个标准、稳定的串行数据流,是确保设备间互联互通的基础。ITU-R BT.656标准(常简称为ITU656)正是为此而生的一套“交通规则”。它定义…

阅读更多
嵌入式GUI开发实战:emWin环境搭建、配置优化与性能调优指南
2026/6/24 16:06:27

嵌入式GUI开发实战:emWin环境搭建、配置优化与性能调优指南

1. 项目概述与emWin核心价值解析在嵌入式系统开发领域,人机交互(HMI)的设计正从简单的LED指示灯和按键,快速向全彩图形化界面演进。无论是智能家电上的触摸屏、工业PLC的操作面板,还是医疗设备的参数显示,一…

阅读更多
Redis容器重启循环问题排查与数据持久化完整指南
2026/6/25 11:59:59

Redis容器重启循环问题排查与数据持久化完整指南

一、问题背景在微服务和云原生开发中,Redis作为高性能缓存数据库被广泛使用。许多开发者会通过Docker部署Redis,并配合Spring Boot应用进行开发。然而,容器运行过程中难免遇到意外故障,例如容器状态异常、端口冲突、数据丢失等。本…

阅读更多
化学机器学习实战:从分子特征到可部署API的七步炼金术
2026/6/25 11:59:59

化学机器学习实战:从分子特征到可部署API的七步炼金术

1. 这不是“AI画分子图”——化学家正在用机器学习重写实验手册“Machine Learning in Chemistry”这个标题听起来像学术会议上的一个分论坛名称,但如果你真去翻看最近五年《Nature Chemistry》《Journal of Chemical Information and Modeling》的高被引论文&#…

阅读更多
如何快速上手Windows 12网页版:面向新手的终极在线体验指南
2026/6/25 11:59:59

如何快速上手Windows 12网页版:面向新手的终极在线体验指南

如何快速上手Windows 12网页版:面向新手的终极在线体验指南 【免费下载链接】win12 Windows 12 网页版,在线体验 点击下面的链接在线体验 项目地址: https://gitcode.com/gh_mirrors/wi/win12 Windows 12网页版在线体验为你提供了一种革命性的操作…

阅读更多
GIT修改用户名
2026/6/24 16:02:34

GIT修改用户名

在GIT中修改用户名可按以下步骤操作: 查看当前git的用户名,使用命令git config --list或git config user.name。修改git用户名,使用命令git config --global user.name "xxx(新的用户名)",将其中…

阅读更多
Win11Debloat:让你的Windows系统重获新生的终极优化工具
2026/6/23 23:39:46

Win11Debloat:让你的Windows系统重获新生的终极优化工具

Win11Debloat:让你的Windows系统重获新生的终极优化工具 【免费下载链接】Win11Debloat A simple, lightweight PowerShell script that allows you to remove pre-installed apps, disable telemetry, as well as perform various other changes to declutter and …

阅读更多
技术深度解析:m4s-converter实现原理与B站缓存视频转换最佳实践
2026/6/24 18:38:44

技术深度解析:m4s-converter实现原理与B站缓存视频转换最佳实践

技术深度解析:m4s-converter实现原理与B站缓存视频转换最佳实践 【免费下载链接】m4s-converter 一个跨平台小工具,将bilibili缓存的m4s格式音视频文件合并成mp4 项目地址: https://gitcode.com/gh_mirrors/m4/m4s-converter m4s-converter是一个…

阅读更多