发布时间:2026/6/14 19:45:02
AI工程师必看!一张图看懂7大模块50+概念,构建你的AI知识图谱体系!
最近在研究怎么把一个agent不局限于某个类型的小龙虾养成有记忆会思考能反思可自进化的专家。其中涉及到很重要的一部分内容就是领域知识的积累。所以就把AI工程相关的知识给做了个搜索归纳和总结先分享出来后续基于这个地图我再一一展开进行学习及实践。下面开始正文5000字左右建议先收藏有时间细读一张图看懂 AI Engineering 全貌——7 大模块、50 核心概念、5 层技术栈帮你建立系统化的 AI 工程认知框架。前言为什么需要一张 AI 工程知识图谱过去两年AI 领域的论文数量呈指数增长新框架每周冒出来新概念层出不穷。很多同学的感受是学不完今天学 RAG明天出 GraphRAG后天又来 Agentic RAG连不上Transformer、Prompt Engineering、Agent、MCP 之间是什么关系用不对知道概念但不知道什么时候用、怎么选型知识图谱解决的就是连不上的问题——不是教你每个概念的细节而是帮你建立概念之间的连接关系形成一张可导航的地图。本文将 AI 工程拆解为 7 大模块每个模块给出核心概念、关键论文、选型决策和模块间关联最终形成一张完整的知识图谱。一、知识图谱总览二、模块 1基石与里程碑核心时间线必读论文 Top 5入门优先级排序Attention Is All You Need (2017) — Transformer所有大模型的祖先GPT-3 (2020) — 涌现能力In-Context LearningInstructGPT (2022) — RLHF 对齐三阶段Chain-of-Thought (2022) — 让模型一步步思考ReAct (2022) — Agent 架构的理论基础关键术语速查三、模块 2大模型架构与训练Transformer 核心结构Self-Attention 直觉类比QQuery “我在找什么”KKey “我是什么”被搜索的标签VValue “我的内容”实际信息就像在图书馆Q 是你的问题K 是书名V 是书的内容。根据问题与书名的匹配度决定花多少注意力在每本书上。训练三阶段核心公式数据质量 数据数量。宁可 1 万条高质量不要 100 万条低质量。高效微调方法选型推理优化模型选型决策树你的场景├── 通用对话/创作 → GPT-4o / Claude Sonnet ├── 复杂推理/数学 → o3 / DeepSeek-R1 ├── 代码生成 → Claude Opus 4 ├── 超长文档 → Gemini 2.0 (1M 窗口) ├── 本地部署/隐私 → Llama 3.1 / Qwen 2.5 ├── 中文场景 → Qwen 2.5 / DeepSeek └── 成本敏感 → DeepSeek-V3四、模块 3Prompt 工程Prompt 的本质完整的 Prompt 角色 上下文 指令 输入 输出格式 约束同一个模型Prompt 不同输出质量可以差 10 倍。核心模式CoT 的变体进化Zero-Shot CoT → Lets think step by step ↓ Few-Shot CoT → 给带推理过程的示例 ↓ Self-Consistency → 多次采样取一致性最高的答案 ↓ Tree of Thoughts → 树状搜索多条推理路径System Prompt 架构设计一个优秀的 System Prompt 应该是分层的System Prompt 身份层 (我是谁) 灵魂层 (我怎么思考) 知识层 (我知道什么) 记忆层 (我经历过什么) 工具层 (我能做什么)Prompt 注入防御2026 前沿Prompt Bloat 问题MCP 工具数量爆炸 → 工具描述塞满 context → LLM 工具选择准确率下降。解法RAG-as-Routing用语义检索预筛选工具top-k只把相关工具注入 Prompt。实测 prompt token 降低 60%。五、模块 4Agent 架构Agent LLM 记忆 工具 规划Agent 核心循环Perceive (感知) → Think (思考) → Act (行动) → Observe (观察) → 循环五大设计模式模式 1ReAct最广泛使用Thought → Action → Observation → Thought → Action → …简单直观但串行执行没有全局规划。模式 2Plan-and-Execute制定完整计划 → 逐步执行 → 根据中间结果 Replan有全局视角适合复杂任务。模式 3Reflexion执行 → 自我评估 → 存储反思 → 下次避免同类错误持续自我改进。模式 4Multi-AgentOrchestrator ├── Researcher → 信息收集 ├── Writer → 内容生成 └── Reviewer → 质量检查—— 分工协作适合复杂工作流。模式 5Tool-Use AgentLLM 决定何时调用什么工具。模型不是执行工具而是生成工具调用的 JSON 描述由外部系统执行。记忆系统设计Agent 框架选型2026 关键洞察Agent 系统工程三角编排 记忆治理 工具可靠性决定 Agent 能否真正落地。六、模块 5上下文工程与 RAG核心矛盾“看到” ≠ “记住”Lost in the Middle 问题模型对上下文开头和结尾更敏感中间部分容易被忽略。即使窗口有 200K实际有效利用的可能只有 50-70%。上下文工程原则上下文 System Prompt (固定层) User Profile (半固定层) Retrieved Knowledge (动态检索层) Conversation History (对话层) Current Query (当前输入层)5 条黄金法则最相关的信息放在开头和结尾System Prompt 越精简越好动态检索胜于静态塞入摘要压缩胜于直接截断结构化Markdown/JSON胜于纯文本RAG 完整流程离线文档 → 解析 → 清洗 → 分块 → Embedding → 向量数据库 在线查询 → Query Embedding → 向量检索 → 重排序 → 拼 Prompt → 生成3.1 分块策略选型最佳实践块大小 256-1024 Token重叠 10-20%。3.2 向量数据库选型3.3 高级 RAG 技术矩阵2026 前沿Agentic RAGRAG 正在从检索工具升级为Agent 基础设施架构选型简单问答 → Agentic RAG成本低跨实体全局推理 → GraphRAG不可替代七、模块 6Skills、MCP 与工具链MCP AI 的 USB 接口MCP (Model Context Protocol) Anthropic 提出的开放协议让 AI 模型标准化地连接外部工具和数据源。MCP Client (AI应用) ←─MCP协议─→ MCP Server (工具提供方) Claude/Cursor/CodeBuddy GitHub/Slack/数据库/文件系统Skill vs Prompt vs Tool2026 关键洞察RAG-MCPMCP 工具超过 30 个后必须启用 RAG-based Skill Router否则工具选择准确率崩溃八、模块 7评估与安全成本计算公式月成本 日均请求数 × 平均 Token 数 × Token 单价 × 30例10000 请求/天 × 2000 Token × $0.003/1K × 30 $1,800/月Agent 评估维度安全红线九、跨模块关联知识图谱的关键边知识图谱的价值不在于节点单个概念而在于边概念间的关系。关键关联 1Transformer → Prompt → AgentTransformer 的 Self-Attention 机制 → 使得模型能理解长距离依赖 → 使得 CoT (链式思考) 成为可能 → 使得 ReAct (推理行动) 成为可能 → Agent 架构的基础关键关联 2Embedding → RAG → AgentEmbedding 将文本映射到向量空间 → 使得语义检索成为可能 → RAG 用 Embedding 检索相关知识 → Agent 用 RAG 扩展知识边界 → Agentic RAG 让 Agent 自主决定检索策略关键关联 3MCP → Skill → AgentMCP 统一工具接口 → Skill 封装为可复用能力单元 → Agent 通过 Skill 调用工具 → RAG-MCP 解决工具选择问题关键关联 4记忆 → 上下文 → 压缩长期记忆文件/向量库 → 上下文窗口有限200K → 需要压缩摘要/截断/检索 → 迭代式摘要 Handoff 框架 → 记忆的 CRUD 遗忘机制十、学习路线图入门路线2-3 周3Blue1Brown 神经网络视频 → 建立直觉Jay Alammar “The Illustrated Transformer” → 理解 Transformer精读模块 1-3基石 架构 Prompt→ 打基础动手写 Prompt跑通 CoT / Few-Shot进阶路线4-6 周搭建一个 ReAct AgentLangChain/LangGraph实现一个 RAG 系统Chroma OpenAI Embedding精读模块 4-6Agent RAG MCP读 Chip Huyen《AI Engineering》深入路线持续精读 ReAct / RAG / CoT 原始论文研究 Hermes Agent 源码上下文压缩 记忆系统设计关注 2026 前沿Agentic RAG / GraphRAG / 推理模型关注 arXiv cs.CL 每月热门论文十一、2026 趋势总结十二、推荐资源结语AI 工程不是一堆孤立概念的堆砌而是一棵从 Transformer 根基长出的知识树Transformer 是根——Self-Attention 机制让一切成为可能Prompt 是干——用自然语言操控模型Agent 是枝——从被动回答到主动行动RAG 是叶——突破知识边界MCP 是果——让 AI 真正连接世界记住这张图你就不会在 AI 工程的知识海洋中迷路。01什么是AI大模型应用开发工程师如果说AI大模型是蕴藏着巨大能量的“后台超级能力”那么AI大模型应用开发工程师就是将这种能量转化为实用工具的执行者。AI大模型应用开发工程师是基于AI大模型设计开发落地业务的应用工程师。这个职业的核心价值在于打破技术与用户之间的壁垒把普通人难以理解的算法逻辑、模型参数转化为人人都能轻松操作的产品形态。无论是日常写作时用到的AI文案生成器、修图软件里的智能美化功能还是办公场景中的自动记账工具、会议记录用的语音转文字APP这些看似简单的应用背后都是应用开发工程师在默默搭建技术与需求之间的桥梁。他们不追求创造全新的大模型而是专注于让已有的大模型“听懂”业务需求“学会”解决具体问题最终形成可落地、可使用的产品。CSDN粉丝独家福利给大家整理了一份AI大模型全套学习资料这份完整版的 AI 大模型学习资料已经上传CSDN朋友们如果需要可以扫描下方二维码点击下方CSDN官方认证链接免费领取【保证100%免费】02AI大模型应用开发工程师的核心职责需求分析与拆解是工作的起点也是确保开发不偏离方向的关键。应用开发工程师需要直接对接业务方深入理解其核心诉求——不仅要明确“要做什么”更要厘清“为什么要做”以及“做到什么程度算合格”。在此基础上他们会将模糊的业务需求拆解为具体的技术任务明确每个环节的执行标准并评估技术实现的可行性同时定义清晰的核心指标为后续开发、测试提供依据。这一步就像建筑前的图纸设计若出现偏差后续所有工作都可能白费。技术选型与适配是衔接需求与开发的核心环节。工程师需要根据业务场景的特点选择合适的基础大模型、开发框架和工具——不同的业务对模型的响应速度、精度、成本要求不同选型的合理性直接影响最终产品的表现。同时他们还要对行业相关数据进行预处理通过提示词工程优化模型输出或在必要时进行轻量化微调让基础模型更好地适配具体业务。此外设计合理的上下文管理规则确保模型理解连贯需求建立敏感信息过滤机制保障数据安全也是这一环节的重要内容。应用开发与对接则是将方案转化为产品的实操阶段。工程师会利用选定的开发框架构建应用的核心功能同时联动各类外部系统——比如将AI模型与企业现有的客户管理系统、数据存储系统打通确保数据流转顺畅。在这一过程中他们还需要配合设计团队打磨前端交互界面让技术功能以简洁易懂的方式呈现给用户实现从技术方案到产品形态的转化。测试与优化是保障产品质量的关键步骤。工程师会开展全面的功能测试找出并修复开发过程中出现的漏洞同时针对模型的响应速度、稳定性等性能指标进行优化。安全合规性也是测试的重点需要确保应用符合数据保护、隐私安全等相关规定。此外他们还会收集用户反馈通过调整模型参数、优化提示词等方式持续提升产品体验让应用更贴合用户实际使用需求。部署运维与迭代则贯穿产品的整个生命周期。工程师会通过云服务器或私有服务器将应用部署上线并实时监控运行状态及时处理突发故障确保应用稳定运行。随着业务需求的变化他们还需要对应用功能进行迭代更新同时编写完善的开发文档和使用手册为后续的维护和交接提供支持。03薪资情况与职业价值市场对这一职业的高度认可直接体现在薪资待遇上。据猎聘最新在招岗位数据显示AI大模型应用开发工程师的月薪最高可达60k。在AI技术加速落地的当下这种“技术业务”的复合型能力尤为稀缺让该职业成为当下极具吸引力的就业选择。AI大模型应用开发工程师是AI技术落地的关键桥梁。他们用专业能力将抽象的技术转化为具体的产品让大模型的价值真正渗透到各行各业。随着AI场景化应用的不断深化这一职业的重要性将更加凸显也必将吸引更多人才投身其中推动AI技术更好地服务于社会发展。CSDN粉丝独家福利给大家整理了一份AI大模型全套学习资料这份完整版的 AI 大模型学习资料已经上传CSDN朋友们如果需要可以扫描下方二维码点击下方CSDN官方认证链接免费领取【保证100%免费】

相关新闻

AI不是你的敌人,而是你飞升的阶梯:产品经理的AI高效协作指南
2026/6/13 15:20:44

AI不是你的敌人,而是你飞升的阶梯:产品经理的AI高效协作指南

一、先对齐认知:AI 是加速器,不是替代品 很多产品经理对待 AI 有两种极端:要么觉得"AI 能帮我搞定一切",要么觉得"AI 输出的东西没法直接用,还是算了"。两种都不对。 更准确的理解是:*…

阅读更多
AI请假准确率99.2%的背后:训练数据清洗、权限沙箱隔离与审计留痕三重硬核实践
2026/6/13 2:23:38

AI请假准确率99.2%的背后:训练数据清洗、权限沙箱隔离与审计留痕三重硬核实践

更多请点击: https://kaifayun.com 第一章:AI请假准确率99.2%的背后:训练数据清洗、权限沙箱隔离与审计留痕三重硬核实践 实现99.2%的AI请假审批准确率,绝非仅靠模型调参或算力堆叠,而是源于对数据质量、运行安全与合…

阅读更多
Vue-Next-Admin实战指南:构建现代化企业级后台管理系统的高效路径
2026/6/12 6:49:21

Vue-Next-Admin实战指南:构建现代化企业级后台管理系统的高效路径

Vue-Next-Admin实战指南:构建现代化企业级后台管理系统的高效路径 【免费下载链接】vue-next-admin 🎉🎉🔥基于vue3.x 、Typescript、vite、Element plus等,适配手机、平板、pc 的后台开源免费模板库(vue2.…

阅读更多
Win10BloatRemover:如何让Windows 10系统变得更轻快、更私密?
2026/6/14 18:57:55

Win10BloatRemover:如何让Windows 10系统变得更轻快、更私密?

Win10BloatRemover:如何让Windows 10系统变得更轻快、更私密? 【免费下载链接】Win10BloatRemover Configurable CLI tool to easily and aggressively debloat and tweak Windows 10 by removing preinstalled UWP apps, services and more. Originally…

阅读更多
为什么LibreDWG是CAD文件转换的终极免费方案?
2026/6/14 18:57:55

为什么LibreDWG是CAD文件转换的终极免费方案?

为什么LibreDWG是CAD文件转换的终极免费方案? 【免费下载链接】libredwg Official mirror of libredwg. With CI hooks and nightly releases. PRs ok 项目地址: https://gitcode.com/gh_mirrors/li/libredwg 你是否曾经因为收到一个DWG文件而无法打开而烦恼…

阅读更多
3步解决Cursor试用限制:免费版无限续用的终极指南
2026/6/14 18:57:55

3步解决Cursor试用限制:免费版无限续用的终极指南

3步解决Cursor试用限制:免费版无限续用的终极指南 【免费下载链接】go-cursor-help 解决Cursor在免费订阅期间出现以下提示的问题: Your request has been blocked as our system has detected suspicious activity / Youve reached your trial request limit. / To…

阅读更多
3分钟快速指南:如何用自然语言彻底解放你的GUI操作
2026/6/14 18:57:55

3分钟快速指南:如何用自然语言彻底解放你的GUI操作

3分钟快速指南:如何用自然语言彻底解放你的GUI操作 【免费下载链接】UI-TARS-desktop The Open-Source Multimodal AI Agent Stack: Connecting Cutting-Edge AI Models and Agent Infra 项目地址: https://gitcode.com/GitHub_Trending/ui/UI-TARS-desktop …

阅读更多
FAST-LIO2实战:在ROS Noetic下部署并跑通自己的数据集(避坑记录)
2026/6/14 18:57:55

FAST-LIO2实战:在ROS Noetic下部署并跑通自己的数据集(避坑记录)

FAST-LIO2实战:在ROS Noetic下部署并跑通自己的数据集(避坑记录)当第一次看到FAST-LIO2在复杂环境下依然能稳定输出厘米级定位精度时,我就被这个开源算法深深吸引了。作为一个长期从事移动机器人定位研究的工程师,我深…

阅读更多
别再纠结了!Halcon和VisionMaster到底怎么选?给工程师的实战避坑指南
2026/6/14 17:57:54

别再纠结了!Halcon和VisionMaster到底怎么选?给工程师的实战避坑指南

Halcon与VisionMaster终极对决:5个真实项目场景下的选型决策框架在机器视觉领域的技术选型会上,总有一个问题会让会议室陷入短暂的沉默:"我们该用Halcon还是VisionMaster?"这个看似简单的选择题背后,隐藏着算…

阅读更多
别再只用BERT了!用Transformers库的AutoModel,5分钟搞定文本相似度计算(附代码对比)
2026/6/14 0:57:30

别再只用BERT了!用Transformers库的AutoModel,5分钟搞定文本相似度计算(附代码对比)

超越BERT:用Transformers库高效实现文本相似度计算的三种实战方案在自然语言处理领域,文本相似度计算是信息检索、问答系统和推荐系统等应用的核心技术。传统方法如TF-IDF或Word2Vec已逐渐被基于Transformer的预训练模型所取代。Hugging Face的Transform…

阅读更多
Prompt Engineering:重构人机协作的工程化方法论
2026/6/14 0:57:30

Prompt Engineering:重构人机协作的工程化方法论

1. 项目概述:这不是“写提示词”,而是重构人机协作的底层逻辑“Prompt Engineering”这个词,这两年被讲得太多,也太轻飘。很多人把它理解成“给AI发指令的技巧”,甚至简化为“多加几个形容词”“换种说法再试一次”。我…

阅读更多
Anthropic提示层归零:模型即协议的工程实践
2026/6/14 0:57:30

Anthropic提示层归零:模型即协议的工程实践

1. 项目概述:这不是一次普通更新,而是一次架构级“蒸发”“Anthropic Just Shipped the Layer That’s Already Going to Zero”——这个标题一出来,我正在调试一个Claude调用链的终端前停了三秒。不是因为震惊,而是因为熟悉&…

阅读更多
别再只用BERT了!用Transformers库的AutoModel,5分钟搞定文本相似度计算(附代码对比)
2026/6/14 0:57:30

别再只用BERT了!用Transformers库的AutoModel,5分钟搞定文本相似度计算(附代码对比)

超越BERT:用Transformers库高效实现文本相似度计算的三种实战方案在自然语言处理领域,文本相似度计算是信息检索、问答系统和推荐系统等应用的核心技术。传统方法如TF-IDF或Word2Vec已逐渐被基于Transformer的预训练模型所取代。Hugging Face的Transform…

阅读更多
Prompt Engineering:重构人机协作的工程化方法论
2026/6/14 0:57:30

Prompt Engineering:重构人机协作的工程化方法论

1. 项目概述:这不是“写提示词”,而是重构人机协作的底层逻辑“Prompt Engineering”这个词,这两年被讲得太多,也太轻飘。很多人把它理解成“给AI发指令的技巧”,甚至简化为“多加几个形容词”“换种说法再试一次”。我…

阅读更多
Anthropic提示层归零:模型即协议的工程实践
2026/6/14 0:57:30

Anthropic提示层归零:模型即协议的工程实践

1. 项目概述:这不是一次普通更新,而是一次架构级“蒸发”“Anthropic Just Shipped the Layer That’s Already Going to Zero”——这个标题一出来,我正在调试一个Claude调用链的终端前停了三秒。不是因为震惊,而是因为熟悉&…

阅读更多
GIT修改用户名
2026/6/14 11:53:59

GIT修改用户名

在GIT中修改用户名可按以下步骤操作: 查看当前git的用户名,使用命令git config --list或git config user.name。修改git用户名,使用命令git config --global user.name "xxx(新的用户名)",将其中…

阅读更多
Win11Debloat:让你的Windows系统重获新生的终极优化工具
2026/6/13 15:45:46

Win11Debloat:让你的Windows系统重获新生的终极优化工具

Win11Debloat:让你的Windows系统重获新生的终极优化工具 【免费下载链接】Win11Debloat A simple, lightweight PowerShell script that allows you to remove pre-installed apps, disable telemetry, as well as perform various other changes to declutter and …

阅读更多
技术深度解析:m4s-converter实现原理与B站缓存视频转换最佳实践
2026/6/14 15:49:58

技术深度解析:m4s-converter实现原理与B站缓存视频转换最佳实践

技术深度解析:m4s-converter实现原理与B站缓存视频转换最佳实践 【免费下载链接】m4s-converter 一个跨平台小工具,将bilibili缓存的m4s格式音视频文件合并成mp4 项目地址: https://gitcode.com/gh_mirrors/m4/m4s-converter m4s-converter是一个…

阅读更多