楼主: 倩倩最漂亮
36 0

AI 相关基础知识 [推广有奖]

  • 0关注
  • 0粉丝

等待验证会员

小学生

42%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
50 点
帖子
4
精华
0
在线时间
0 小时
注册时间
2018-8-13
最后登录
2018-8-13

楼主
倩倩最漂亮 发表于 2025-11-12 20:37:49 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

一、常见 AI 术语

  1. MCP (Model Context Protocol)
    • 含义:一种标准协议,主要用于让不同的大型语言模型(LLM)与外部工具、插件或服务进行互动。
    • 作用:例如,使 ChatGPT 可以通过 MCP 使用浏览器、数据库、代码执行器等工具。
  2. Agent (智能体 / AI Agent)
    • 含义:一种基于大型语言模型的“自主程序”,能够接收目标,规划步骤,并调用工具来完成任务。
    • 作用:如 curosr 可以通过输入自然语言自行更改代码。
  3. LLM (Large Language Model)
    • 含义:LLM 是一种基于 Transformer 架构的超大规模神经网络,它通过预测下一个词来“掌握”语言,从而具备理解和生成自然语言的能力。
    • 为什么叫“大”?
      • 参数量巨大:通常包含数十亿、数千亿甚至上万亿参数(如 GPT-4、Gemini、Claude 等)。
      • 数据规模庞大:使用互联网上的大量文本(书籍、论文、代码、对话、网页等)进行训练。
      • 计算资源惊人:训练需要数千块 GPU/TPU 并行计算,耗时数周甚至数月。
      • “大” 代表模型的复杂度和能力。
    • LLM 的优缺点
      • 优点:
        • 通用性强(不局限于某个领域)
        • 能进行“零样本/少样本学习”(从未见过的任务也能尝试回答)
        • 表达自然,贴近人类语言
      • 缺点:
        • 幻觉(Hallucination):可能一本正经地胡说八道
        • 知识过时:模型的知识截止到训练时间
        • 计算成本高:训练和推理都非常耗算力
        • 难以解释:很难完全理解它内部为何如此回答
  4. RAG (Retrieval-Augmented Generation)
    • 含义:检索增强生成,先搜索资料,再结合生成回答,常用于知识问答。
    • 背景问题:
      • 传统大型语言模型(LLM)虽然强大,但也有一些痛点:
        • 知识时效性差:训练数据只到某个时间点,之后的新知识不知晓。
        • 记忆有限:模型参数无法包含所有知识。
        • 幻觉问题:模型有时会“编造”答案,看似合理但实际错误。
    • 核心思想:在生成答案之前,先去“查找资料”,然后再结合模型的语言能力生成回答。
    • 一句话理解:RAG = 检索(Retrieval) + 生成(Generation)
    • 工作流程:
      • 用户提问:例如,“请帮我总结一下 OpenAI 的最新研究论文内容。”
      • 检索(Retrieval):系统先把用户问题转换成向量表示(Embedding),去知识库/数据库/互联网检索最相关的资料片段,返回几个高相关的文档。
      • 增强(Augmentation):把检索到的文档内容 + 用户问题一起作为 Prompt。
        用户问题:请总结最新论文内容 相关文档片段:……
      • 生成(Generation):LLM 在有外部资料的前提下生成答案,这样回答既贴近真实资料,又减少幻觉。
    • 典型应用场景:
      • 智能问答:企业知识库问答、法律/医疗问答
      • 搜索引擎增强:像 Perplexity、Kimi 就使用 RAG
      • 文档助手:上传 PDF/Word 后问问题
      • 企业数据分析:在内部数据上进行自然语言交互

二、常用的AI编程大模型

  1. OpenAI 系列
    • GPT-4 / GPT-4o / GPT-o1:目前最通用的代码生成模型,能写代码、解释报错、做代码审查。常见应用:ChatGPT、GitHub Copilot X。支持多语言(Python、JS、C++、Java、Go 等)。
  2. Anthropic 系列
    • Claude 3.5:在长代码上下文处理上表现良好,适合代码重构、大型项目解释。对安全性和可读性进行了优化。
  3. Google 系列
    • Gemini 1.5 / Gemini 2.0:原 Bard,支持多模态(文本、代码、图片),集成到 Google Workspace(Docs、Sheets、Colab)。编程能力正在追赶 GPT 系列。
  4. 专门为编程优化的模型
    • GitHub Copilot (基于 OpenAI Codex / GPT-4 Turbo):最常见的 AI 编程助手,适合边写边补全(IDE 插件)。
    • Code Llama (Meta):LLaMA 系列的代码专版,开源,支持 Python、C++、Java、JS 等。
    • DeepSeek Coder:多语言代码模型,强调代码补全 + 中英文解释。
    • StarCoder / StarCoder2(HuggingFace + ServiceNow):专门针对编程任务的开源模型,训练在大规模代码库上。
  5. 国内常见编程大模型
    • 通义灵码(阿里):集成在 IDEA、VS Code 中,中文代码解释能力强。
    • 百度 Comate(基于文心大模型):更适合中文语境下的开发。
    • 字节豆包 / 火山引擎 CodeGeeX2:清华团队参与,开源可商用。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:基础知识 Augmentation Generation Retrieval WORKSPACE
相关内容:AI知识基础

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-12 02:40