发帖

楼主: 倩倩最漂亮

60 0

AI 相关基础知识 [推广有奖]

0关注
0粉丝

等待验证会员

小学生

42%

还不是VIP/贵宾

-

0%

威望: 0 级
论坛币: 0 个
通用积分: 0
学术水平: 0 点
热心指数: 0 点
信用等级: 0 点
经验: 50 点
帖子: 4
精华: 0
在线时间: 0 小时
注册时间: 2018-8-13
最后登录: 2018-8-13

楼主

倩倩最漂亮 发表于 2025-11-12 20:37:49 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

一、常见 AI 术语

MCP (Model Context Protocol)
- 含义：一种标准协议，主要用于让不同的大型语言模型（LLM）与外部工具、插件或服务进行互动。
- 作用：例如，使 ChatGPT 可以通过 MCP 使用浏览器、数据库、代码执行器等工具。
Agent (智能体 / AI Agent)
- 含义：一种基于大型语言模型的“自主程序”，能够接收目标，规划步骤，并调用工具来完成任务。
- 作用：如 curosr 可以通过输入自然语言自行更改代码。
LLM (Large Language Model)
- 含义：LLM 是一种基于 Transformer 架构的超大规模神经网络，它通过预测下一个词来“掌握”语言，从而具备理解和生成自然语言的能力。
- 为什么叫“大”？
  - 参数量巨大：通常包含数十亿、数千亿甚至上万亿参数（如 GPT-4、Gemini、Claude 等）。
  - 数据规模庞大：使用互联网上的大量文本（书籍、论文、代码、对话、网页等）进行训练。
  - 计算资源惊人：训练需要数千块 GPU/TPU 并行计算，耗时数周甚至数月。
  - “大” 代表模型的复杂度和能力。
- LLM 的优缺点
  - 优点：
    - 通用性强（不局限于某个领域）
    - 能进行“零样本/少样本学习”（从未见过的任务也能尝试回答）
    - 表达自然，贴近人类语言
  - 缺点：
    - 幻觉（Hallucination）：可能一本正经地胡说八道
    - 知识过时：模型的知识截止到训练时间
    - 计算成本高：训练和推理都非常耗算力
    - 难以解释：很难完全理解它内部为何如此回答
RAG (Retrieval-Augmented Generation)
- 含义：检索增强生成，先搜索资料，再结合生成回答，常用于知识问答。
- 背景问题：
  - 传统大型语言模型（LLM）虽然强大，但也有一些痛点：
    - 知识时效性差：训练数据只到某个时间点，之后的新知识不知晓。
    - 记忆有限：模型参数无法包含所有知识。
    - 幻觉问题：模型有时会“编造”答案，看似合理但实际错误。
- 核心思想：在生成答案之前，先去“查找资料”，然后再结合模型的语言能力生成回答。
- 一句话理解：RAG = 检索（Retrieval） + 生成（Generation）
- 工作流程：
  - 用户提问：例如，“请帮我总结一下 OpenAI 的最新研究论文内容。”
  - 检索（Retrieval）：系统先把用户问题转换成向量表示（Embedding），去知识库/数据库/互联网检索最相关的资料片段，返回几个高相关的文档。
  - 增强（Augmentation）：把检索到的文档内容 + 用户问题一起作为 Prompt。
```
用户问题：请总结最新论文内容 相关文档片段：……
```
  - 生成（Generation）：LLM 在有外部资料的前提下生成答案，这样回答既贴近真实资料，又减少幻觉。
- 典型应用场景：
  - 智能问答：企业知识库问答、法律/医疗问答
  - 搜索引擎增强：像 Perplexity、Kimi 就使用 RAG
  - 文档助手：上传 PDF/Word 后问问题
  - 企业数据分析：在内部数据上进行自然语言交互

二、常用的AI编程大模型

OpenAI 系列
- GPT-4 / GPT-4o / GPT-o1：目前最通用的代码生成模型，能写代码、解释报错、做代码审查。常见应用：ChatGPT、GitHub Copilot X。支持多语言（Python、JS、C++、Java、Go 等）。
Anthropic 系列
- Claude 3.5：在长代码上下文处理上表现良好，适合代码重构、大型项目解释。对安全性和可读性进行了优化。
Google 系列
- Gemini 1.5 / Gemini 2.0：原 Bard，支持多模态（文本、代码、图片），集成到 Google Workspace（Docs、Sheets、Colab）。编程能力正在追赶 GPT 系列。
专门为编程优化的模型
- GitHub Copilot (基于 OpenAI Codex / GPT-4 Turbo)：最常见的 AI 编程助手，适合边写边补全（IDE 插件）。
- Code Llama (Meta)：LLaMA 系列的代码专版，开源，支持 Python、C++、Java、JS 等。
- DeepSeek Coder：多语言代码模型，强调代码补全 + 中英文解释。
- StarCoder / StarCoder2（HuggingFace + ServiceNow）：专门针对编程任务的开源模型，训练在大规模代码库上。
国内常见编程大模型
- 通义灵码（阿里）：集成在 IDEA、VS Code 中，中文代码解释能力强。
- 百度 Comate（基于文心大模型）：更适合中文语境下的开发。
- 字节豆包 / 火山引擎 CodeGeeX2：清华团队参与，开源可商用。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏0 回帖

关键词：基础知识 Augmentation Generation Retrieval WORKSPACE

AI 相关基础知识 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

一、常见 AI 术语

二、常用的AI编程大模型

扫码加我拉你入群

相关帖子 AI

浏览过的帖子

浏览过的版块

本版微信群

AI 相关基础知识 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

一、常见 AI 术语

二、常用的AI编程大模型

扫码加我 拉你入群

相关帖子 AI

浏览过的帖子

浏览过的版块

本版微信群

扫码加我拉你入群