发帖

楼主: 三江汇友

94 0

RAG, Agentic RAG, and AI Memory 一文看懂 AI 技术演进 [推广有奖]

0关注
0粉丝

等待验证会员

学前班

80%

还不是VIP/贵宾

-

0%

威望: 0 级
论坛币: 0 个
通用积分: 0.0144
学术水平: 0 点
热心指数: 0 点
信用等级: 0 点
经验: 30 点
帖子: 2
精华: 0
在线时间: 0 小时
注册时间: 2018-10-9
最后登录: 2018-10-9

楼主

三江汇友 发表于 2025-12-4 18:33:37 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

大家好，我是玄姐。

▼?《双12 AI 原生应用落地专场》直播

预约即可收获实用干货

RAG 并非技术终点，真正的核心在于“记忆能力”。AI 智能体的未来，正由是否具备持续学习与个性化记忆的能力所决定。接下来，我们将用最易懂的方式，梳理这场技术演进的过程。

一、三代技术演进：从“只会查”到“会学、会记”

1. RAG（2020–2023 年）：一次性检索，即用即丢
核心机制：根据问题进行一次信息检索，并直接生成回答
特点：仅执行“查找 + 回复”，无自主决策能力
局限性：容易返回无关内容。例如你询问“北京周末小众景点”，系统却推送大量热门景区攻略

2. 智能体驱动型 RAG（Agentic RAG）：带判断的检索
核心机制：引入智能体做三项关键决策——是否需要检索、选择哪个数据源、结果是否有效
特点：比传统 RAG 更具筛选能力，但仍处于“只读”状态
局限性：无法记住用户历史行为，比如不知道你之前说过“不喜欢爬山”

3. AI 记忆（AI Memory）：可读可写，经验积累型交互
核心机制：不仅能读取外部知识，还能将对话中的关键信息“写入”自身知识库
特点：能够存储用户偏好、过往对话细节和重要信息，实现真正意义上的个性化服务
关键突破：无需重新训练模型，通过每次互动逐步丰富知识体系，越用越懂用户

三代技术一句话对比：
RAG：只读模式，单次使用
Agentic RAG：通过工具实现“有判断的只读”
AI 记忆：通过工具实现“可读可写”的动态成长

二、AI 记忆的核心价值：让 AI 从“静态工具”进化为“自适应伙伴”

AI 记忆的最大优势，在于赋予智能体“长期记忆”能力。它能记住你的饮食禁忌、工作节奏、重要日程等信息，并在后续交互中自动调用。这解锁了“持续学习”这一关键功能——以往模型一旦训练完成便固定不变；而现在，智能体可以在每一次任务执行和对话中积累经验，无需重训即可不断提升表现。

可以说，记忆是连接“僵化模型”与“灵活 AI 系统”的桥梁。不过，该技术也面临挑战：可能出现记忆混淆（信息污染）、难以判断哪些内容应被遗忘、还需区分不同记忆类型（如操作流程、个人经历、专业知识）。

若希望快速为智能体构建类人记忆能力，可尝试开源框架 Graphiti（实时知识图谱工具），支持动态记忆管理。

三、AI 工程师必须掌握的 8 大核心技能：远不止提示词编写

驾驭大语言模型（LLM）绝非仅靠“写好提示词”就能胜任。要构建生产级 LLM 系统，需掌握以下八项关键技术。以下是通俗解读与核心要点：

1. 提示词工程（Prompt Engineering）
通俗理解：为 AI 编写清晰的操作指南，减少误解，提升输出稳定性
关键实践：持续迭代提示版本、采用“思维链”推理方式、加入少量正确示例（少样本学习），将提示设计视为可复用的工程流程，而非随机试错

2. 上下文工程（Context Engineering）
通俗理解：精准地向 AI 输入所需信息，包括数据库内容、记忆记录或工具返回结果
关键实践：平衡信息完整性与 token 使用效率、处理检索噪声、避免因上下文过长导致关键信息丢失或失效

3. 模型微调（Fine-tuning）
通俗理解：对基础模型进行专项训练，使其适配特定领域（如医疗咨询、法律文书）
关键实践：采用 LoRA/QLoRA 等轻量级方法以节省算力成本、准备高质量训练数据（去重、格式统一）、防止过拟合或泛化能力不足

4. RAG 系统搭建（RAG Systems）
通俗理解：为 AI 配备“外置大脑”，利用向量数据库与嵌入技术降低幻觉风险
关键实践：优化检索链路（索引策略、文本分块、查询改写）、将检索结果与原始问题进行结构化融合

5. 智能体开发（Agents）
通俗理解：使 AI 能够自主完成复杂任务，包括规划步骤、调用工具、应对异常情况
关键实践：维护任务状态、处理工具调用失败场景、设计备用方案（如 API 错误时的响应机制）

6. LLM 部署（LLM Deployment）
通俗理解：将开发完成的 LLM 应用部署上线，提供稳定可用的服务接口
关键实践：控制响应延迟与并发处理能力、实现自动扩缩容、添加安全防护措施（防滥用）、监控每条请求的成本消耗

7. LLM 优化（LLM Optimization）
通俗理解：对模型进行性能压缩与加速，降低运行开销
关键实践：运用量化、剪枝、蒸馏等技术减少内存占用，综合权衡速度、准确率与硬件资源（如 CPU 或 GPU 的选择）

8. LLM 可观测性（LLM Observability）
通俗理解：全面监控 AI 行为，追踪输出质量、延迟、错误及成本变化
关键实践：建立日志追踪体系、可视化关键指标、识别异常输出模式、支持快速定位与调试问题

通俗理解：为 AI 系统“安装监控”，实时掌握其运行状态，及时发现行为异常或输出偏差。

核心操作包括：追踪令牌消耗情况、识别响应延迟的高峰期、监测提示词是否发生偏移（即逐渐偏离初始设计目标），并利用这些监控数据持续进行模型优化与迭代。

除了上述 8 项能力外，你认为 AI 工程师还应具备哪些关键技能？欢迎一起探讨。

以上就是本次分享的主要内容。若你对企业级 AI 原生应用的架构设计与落地实践感兴趣，可继续关注后续更新。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏0 回帖

关键词：memory agent NTIC Age TIC

RAG, Agentic RAG, and AI Memory 一文看懂 AI 技术演进 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

一、三代技术演进：从“只会查”到“会学、会记”

二、AI 记忆的核心价值：让 AI 从“静态工具”进化为“自适应伙伴”

三、AI 工程师必须掌握的 8 大核心技能：远不止提示词编写

扫码加我拉你入群

相关帖子 AI

浏览过的帖子

浏览过的版块

本版微信群

RAG, Agentic RAG, and AI Memory 一文看懂 AI 技术演进 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

一、三代技术演进：从“只会查”到“会学、会记”

二、AI 记忆的核心价值：让 AI 从“静态工具”进化为“自适应伙伴”

三、AI 工程师必须掌握的 8 大核心技能：远不止提示词编写

扫码加我 拉你入群

相关帖子 AI

浏览过的帖子

浏览过的版块

本版微信群

扫码加我拉你入群