- 阅读权限
- 255
- 威望
- 0 级
- 论坛币
- 0 个
- 通用积分
- 0
- 学术水平
- 0 点
- 热心指数
- 0 点
- 信用等级
- 0 点
- 经验
- 50 点
- 帖子
- 4
- 精华
- 0
- 在线时间
- 0 小时
- 注册时间
- 2018-8-13
- 最后登录
- 2018-8-13
小学生
还不是VIP/贵宾
- 威望
- 0 级
- 论坛币
 - 0 个
- 通用积分
- 0
- 学术水平
- 0 点
- 热心指数
- 0 点
- 信用等级
- 0 点
- 经验
- 50 点
- 帖子
- 4
- 精华
- 0
- 在线时间
- 0 小时
- 注册时间
- 2018-8-13
- 最后登录
- 2018-8-13
|
经管之家送您一份
应届毕业生专属福利!
求职就业群
感谢您参与论坛问题回答
经管之家送您两个论坛币!
+2 论坛币
一、常见 AI 术语
-
MCP (Model Context Protocol)
- 含义:一种标准协议,主要用于让不同的大型语言模型(LLM)与外部工具、插件或服务进行互动。
- 作用:例如,使 ChatGPT 可以通过 MCP 使用浏览器、数据库、代码执行器等工具。
-
Agent (智能体 / AI Agent)
- 含义:一种基于大型语言模型的“自主程序”,能够接收目标,规划步骤,并调用工具来完成任务。
- 作用:如 curosr 可以通过输入自然语言自行更改代码。
-
LLM (Large Language Model)
- 含义:LLM 是一种基于 Transformer 架构的超大规模神经网络,它通过预测下一个词来“掌握”语言,从而具备理解和生成自然语言的能力。
- 为什么叫“大”?
- 参数量巨大:通常包含数十亿、数千亿甚至上万亿参数(如 GPT-4、Gemini、Claude 等)。
- 数据规模庞大:使用互联网上的大量文本(书籍、论文、代码、对话、网页等)进行训练。
- 计算资源惊人:训练需要数千块 GPU/TPU 并行计算,耗时数周甚至数月。
- “大” 代表模型的复杂度和能力。
- LLM 的优缺点
- 优点:
- 通用性强(不局限于某个领域)
- 能进行“零样本/少样本学习”(从未见过的任务也能尝试回答)
- 表达自然,贴近人类语言
- 缺点:
- 幻觉(Hallucination):可能一本正经地胡说八道
- 知识过时:模型的知识截止到训练时间
- 计算成本高:训练和推理都非常耗算力
- 难以解释:很难完全理解它内部为何如此回答
-
RAG (Retrieval-Augmented Generation)
- 含义:检索增强生成,先搜索资料,再结合生成回答,常用于知识问答。
- 背景问题:
- 传统大型语言模型(LLM)虽然强大,但也有一些痛点:
- 知识时效性差:训练数据只到某个时间点,之后的新知识不知晓。
- 记忆有限:模型参数无法包含所有知识。
- 幻觉问题:模型有时会“编造”答案,看似合理但实际错误。
- 核心思想:在生成答案之前,先去“查找资料”,然后再结合模型的语言能力生成回答。
- 一句话理解:RAG = 检索(Retrieval) + 生成(Generation)
- 工作流程:
- 用户提问:例如,“请帮我总结一下 OpenAI 的最新研究论文内容。”
- 检索(Retrieval):系统先把用户问题转换成向量表示(Embedding),去知识库/数据库/互联网检索最相关的资料片段,返回几个高相关的文档。
- 增强(Augmentation):把检索到的文档内容 + 用户问题一起作为 Prompt。
- 生成(Generation):LLM 在有外部资料的前提下生成答案,这样回答既贴近真实资料,又减少幻觉。
- 典型应用场景:
- 智能问答:企业知识库问答、法律/医疗问答
- 搜索引擎增强:像 Perplexity、Kimi 就使用 RAG
- 文档助手:上传 PDF/Word 后问问题
- 企业数据分析:在内部数据上进行自然语言交互
二、常用的AI编程大模型
- OpenAI 系列
- GPT-4 / GPT-4o / GPT-o1:目前最通用的代码生成模型,能写代码、解释报错、做代码审查。常见应用:ChatGPT、GitHub Copilot X。支持多语言(Python、JS、C++、Java、Go 等)。
- Anthropic 系列
- Claude 3.5:在长代码上下文处理上表现良好,适合代码重构、大型项目解释。对安全性和可读性进行了优化。
- Google 系列
- Gemini 1.5 / Gemini 2.0:原 Bard,支持多模态(文本、代码、图片),集成到 Google Workspace(Docs、Sheets、Colab)。编程能力正在追赶 GPT 系列。
- 专门为编程优化的模型
- GitHub Copilot (基于 OpenAI Codex / GPT-4 Turbo):最常见的 AI 编程助手,适合边写边补全(IDE 插件)。
- Code Llama (Meta):LLaMA 系列的代码专版,开源,支持 Python、C++、Java、JS 等。
- DeepSeek Coder:多语言代码模型,强调代码补全 + 中英文解释。
- StarCoder / StarCoder2(HuggingFace + ServiceNow):专门针对编程任务的开源模型,训练在大规模代码库上。
- 国内常见编程大模型
- 通义灵码(阿里):集成在 IDEA、VS Code 中,中文代码解释能力强。
- 百度 Comate(基于文心大模型):更适合中文语境下的开发。
- 字节豆包 / 火山引擎 CodeGeeX2:清华团队参与,开源可商用。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
|
|
|