发帖

楼主: wateralways

480 0

[其他] AI 超级大脑深度说明书：大模型从 “出生” 到 “上岗” 全解析 [推广有奖]

0关注
0粉丝

等待验证会员

小学生

14%

还不是VIP/贵宾

-

0%

威望: 0 级
论坛币: 0 个
通用积分: 0
学术水平: 0 点
热心指数: 0 点
信用等级: 0 点
经验: 40 点
帖子: 3
精华: 0
在线时间: 0 小时
注册时间: 2018-10-29
最后登录: 2018-10-29

楼主

wateralways 发表于 2025-12-3 15:40:44 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

大模型堪称人工智能领域的“全能大脑”，不仅能理解文字、解析图像，还具备类似人类的推理与创造能力。本文将用贴近生活的场景化方式，深入浅出地拆解其核心技术路径——从模型分类、训练过程、硬件存储到评估部署，层层递进，带你全面掌握大模型的运作逻辑。

# 全量评测（67个学科，每个学科测5题）
lm_eval --model hf \
--model_args pretrained=/workspace/example/qwen, dtype=float16, trust_remote_code=True \
--tasks cmmlu \
--batch_size auto \
--Limit 5 \
--output_path /workspace/result_cmmlu \
2>&1 | tee /workspace/result_cmmlu/run_new.log

一、大模型的家族谱系：各有所长的“专业选手”

大模型并非千篇一律，而是依据功能定位划分为多个分支，每个分支专注于特定任务领域：

1. 视觉模型：AI 中的“视觉艺术家”

核心职责：聚焦图像数据处理，实现“以图识图”或“由文生图”的转换。

关键技术构成：

CNN（卷积神经网络）：如 ResNet、EfficientNet，是图像识别的基石技术，擅长图像分类和特征提取，可精准判断图像内容属于猫、狗还是车辆，识别效率高、准确率强。
Vision Transformer（ViT）：基于 Transformer 架构发展而来，突破传统 CNN 的局限性，适用于图像分割（如分离人物与背景）、复杂场景理解等精细化视觉任务。
生成型视觉模型：代表有 DALL·E 和 Stable Diffusion，被称为“AI 绘画师”。只需输入一段文字描述（例如“一只在太空站喝咖啡的猫咪”），即可生成对应画面，并支持风格迁移、背景替换等图像编辑操作。

典型应用场景：自动驾驶中的道路环境感知、手机相机的智能场景识别、电商平台的商品图像自动归类、艺术创作辅助设计，以及医学影像中病灶区域的自动检测。

python -m vllm.entrypoints.api_server --model /workspace/example/qwen --dtype float16 --port 8000

2. 多模态模型：跨媒介的“通才型选手”

核心定位：打破单一数据类型的壁垒，融合文本、图像、语音、视频等多种信息形式，实现跨模态的理解与交互。

代表性模型及其能力：

CLIP（OpenAI 开发）：专精图文匹配，能理解文字与图像之间的语义关联。例如输入“金色沙滩上的日落”，可从大量图片中检索出相符画面；反之，给定一张图片也能生成贴切的文字说明。
GPT-4：具备多模态处理能力，支持图文联合输入，既能分析图表并撰写报告，也可根据手写笔记整理成规范文档，还能结合图像进行故事创作或文案配文。
Flamingo（DeepMind 推出）：专注于视觉-语言任务优化，在“看图说话”“图文问答”方面表现突出。例如上传一张菜肴照片，它不仅能描述食材和做法，还可推荐搭配饮品。

实际应用方向：跨模态搜索（用文字找图或以图搜文）、视频内容结构化分析（提取关键帧+生成字幕）、社交媒体图文内容自动生成（如公众号推文配图文案一体化）、无障碍服务（为视障用户描述图像内容）等。

import requests

url = "http://localhost:8000/v1/completions"
headers = {"Content-Type": "application/json"}
data = {
    "model": "Qwen2.5-3B-Instruct",
    "prompt": "写一篇100字左右的口红文案，突出滋润、显白特点",
    "max_tokens": 150,
    "temperature": 0.7  # 0-1，越高越有创造力
}

response = requests.post(url, json=data)
print(response.json()["choices"][0]["text"])

3. 大语言模型（LLM）：自然语言的“文字掌控者”

主要职能：专注处理文本相关任务，精通阅读、写作、翻译与问答，是当前应用最广泛的大模型类型。

底层机制：本质上是一种“概率预测系统”，通过计算词语序列出现的可能性，判断语句是否符合人类表达习惯，并据此预测下一个词，从而生成流畅连贯的文本内容。

主流架构分类：

Encoder-only 模型：典型代表包括 BERT、RoBERTa、DeBERTa，采用双向编码机制，擅长深度理解文本含义，如同“阅读理解专家”——可用于情感分析、关键词抽取、命名实体识别（如人名、地点）、垃圾信息过滤等任务。
Decoder-only 模型：如 GPT 系列、LLaMA、GPT-NeoX，采用单向生成机制，类似“写作达人”，善于续写文章、编写代码、回答问题，常用于聊天机器人、创意文案生成、编程辅助等场景。
Encoder-Decoder 架构：代表模型有 T5、BART、Flan-T5，兼具理解和生成能力，形同“翻译与改写高手”，适用于机器翻译、文本摘要、内容重写等任务，比如将一篇长报告压缩为简明摘要，或将中文内容准确译为英文。

常见落地场景：智能客服系统、广告文案撰写、代码自动生成、学术论文辅助写作、知识问答引擎、多语言翻译、新闻摘要提取等，几乎渗透所有涉及文本处理的行业领域。

二、大模型的成长历程：从“初学者”到“专家级”的三阶段进化

大模型的能力并非与生俱来，而是通过系统化的训练流程逐步构建，类似于人类从基础教育到专业深造的学习路径：

1. 预训练阶段：海量数据打基础（无监督 / 自监督学习）

目标设定：让模型广泛接触各类文本，掌握通用语言规律和常识性知识，建立初步的认知框架。

训练数据来源：

图书资源：BookCorpus 包含约 1.1 万本未出版书籍，总计 9.85 亿字，被用于 RoBERTa、T5 等模型的基础训练。
网页抓取数据：Common Crawl 提供数十亿网页提取的 TB 级原始语料，每月更新一次，GPT-3 和 LLaMA 均依赖此数据源。
百科全书内容：Wikipedia 的多语言版本提供了丰富的结构化知识，仅英文版就达 19.88GB，覆盖科学、历史、文化等多个领域。
多语言语料库：ROOTS 数据集规模达 1.6TB，涵盖 59 种语言，专为训练 BLOOM 这类多语言大模型而设计。

该阶段主要采用自监督学习策略，模型通过掩码预测、下一句判断等方式自主学习语言模式，无需人工标注标签。

无监督学习：自主发现数据规律

在无监督学习中，模型无需依赖人工标注的标签，而是通过分析原始数据自行挖掘潜在模式。例如，它可以学习词语之间的常见搭配——“喝”通常与“水”“咖啡”等连用，而不会与“石头”搭配；同时也能掌握基本语法结构，如理解“主语 + 谓语 + 宾语”的句子构成方式。

这种训练方式使模型具备初步的语言判断能力，能够识别一句话是否通顺自然，并积累一定的常识性知识，比如知道“中国首都是北京”或“地球是圆的”这类事实信息。

微调（SFT）：面向特定任务的精细化训练

监督学习阶段的核心目标是对模型进行专项优化，使其在具体应用场景中表现更精准、输出更符合人类预期。

训练所使用的数据来源于带有明确标注的专用数据集。例如，在训练翻译模型时，采用“原文—译文”成对语料；进行情感分析任务时，则使用标注为“积极”或“消极”的句子样本。

这一过程类似于给模型布置作业并提供标准答案供其对照调整。以电商文案生成为例，模型会学习如何将产品卖点与吸引用户的表达风格相结合，从而提升输出质量。

经过微调后，模型可高效完成特定任务，如专门撰写口红广告文案、手机测评内容，或准确区分用户评论属于“好评”还是“差评”。

RLHF：基于人类反馈的强化校准

该阶段旨在让模型更好地理解人类偏好，输出更加安全、可靠且符合伦理规范的内容，避免产生误导、冒犯或荒谬的回答。

整个流程分为三个步骤：

数据收集：由人工评审员对模型生成的多个回答进行评分（如“有用=3分，一般=2分，无用=1分”），构建出反映人类偏好的数据集；
奖励模型训练：利用上述评分数据训练一个独立的“奖励模型”，使其能够自动评估回答的质量高低；
强化学习优化：大模型在生成回答后，由奖励模型打分，再根据分数反馈调整自身参数——优质回答被强化，低质回答被修正。

最终成果包括：模型能拒绝不当请求（如“教我做坏事”）、减少虚构信息的生成、在面对“减肥方法”等提问时推荐科学合理的方案而非极端建议，整体回应更具实用性与人性化。

大模型的运行基础：硬件配置、参数规模与存储格式

要保障大模型稳定运行，必须配备强大的硬件支持和高效的存储机制，这相当于为AI系统搭建“高性能主机”和“智能文件管理系统”。

1. 参数规模：衡量模型能力的关键指标

参数是大模型的核心组成部分，可类比为人类大脑中的神经元数量。参数越多，理论上模型处理复杂任务的能力越强。常见的单位如下：

K（千）：1K = 1,000，适用于小型模型，如100K参数级别，常用于简单文本分类任务；
M（百万）：1M = 100万，中等规模模型代表如BERT-base（约1.1亿参数），适合日常语言理解场景；
B（十亿）：1B = 10亿，大型模型如GPT-3（175B参数）、LLaMA系列（13B–65B参数），可胜任复杂问答与内容创作；
T（万亿）：1T = 1,000亿，超大规模模型如GPT-4（约1.76T参数），展现出“涌现能力”，即能执行未直接训练过的跨领域任务，如逻辑推理与创意写作。

2. 硬件支撑：驱动模型运行的计算引擎

由于大模型在训练与推理过程中需要极高的算力，普通设备难以承载，必须依赖专业级硬件设备：

GPU（图形处理器）：当前最主流的AI加速硬件，擅长并行处理大量小规模计算任务，如同“多线程工厂”。NVIDIA是主要供应商，典型型号包括A100（40GB显存）和H100（80GB显存），广泛用于各类大模型训练与推理任务。例如，加载一个7B参数的FP16精度模型大约需要14GB显存。

[picture1]

TPU（张量处理单元）：谷歌专为AI设计的定制芯片，专注于张量运算，效率高于通用GPU。例如TPU V3（32GB显存），在谷歌内部的大模型项目中广泛应用，尤其适合大规模分布式训练。

其他辅助硬件：华为昇腾Ascend芯片也提供国产化替代方案；CPU虽不适用于大型模型训练，但在边缘设备或轻量级推理中仍具价值；此外，充足的内存（RAM）对于协同显存处理大批量数据至关重要，防止因资源不足导致训练中断。

3. 存储格式：模型权重的组织方式

训练完成后，模型的权重（即“学到的知识”）需以特定格式保存，不同用途对应不同的文件类型，类似于文档的不同后缀格式。

格式类别	常见后缀	核心特点	适用场景	对应推理框架
原生训练格式	.pth、.pt、.bin	PyTorch原生格式，包含权重与模型结构，依赖Python环境	模型开发、学术研究、微调训练	PyTorch、Hugging Face Transformers
安全标准格式	.safetensors	加载速度快，零内存拷贝，仅存储数据，防止恶意代码注入	模型发布、下载、日常推理	vLLM、TGI、Xinference
通用交换格式	.onnx	跨平台兼容，采用静态计算图，作为中间转换桥梁	跨语言调用（如C++、Java）、格式转换	ONNX Runtime、Triton Server

[picture2]

高性能与轻量化模型格式详解

适用于 CPU 与边缘设备的模型格式（.gguf，旧版 .ggml）
该格式以极致压缩为特点，专为 CPU 及移动端设备优化，采用单文件封装形式，便于在资源受限环境中部署。支持在 Mac、普通笔记本、智能手机以及树莓派等设备上实现离线运行。常见推理框架包括 Ollama、llama.cpp 和 LM Studio，适合个人开发者快速搭建本地化应用。

# 全量评测（67个学科，每个学科测5题）
lm_eval --model hf \
--model_args pretrained=/workspace/example/qwen, dtype=float16, trust_remote_code=True \
--tasks cmmlu \
--batch_size auto \
--Limit 5 \
--output_path /workspace/result_cmmlu \
2>&1 | tee /workspace/result_cmmlu/run_new.log

NVIDIA 专用高性能推理格式（.engine、.plan）
此类为编译后的二进制文件，专用于 NVIDIA GPU 环境，具备最快的推理速度，适用于工业级高并发服务和低延迟场景。典型支持框架为 TensorRT 和 Triton Server，广泛应用于企业级生产环境中的大规模模型部署。

移动端专用轻量格式（.tflite）
针对安卓与 iOS 平台深度优化，具有低功耗、小体积的特点，适合集成到手机 APP 中，如语音助手、本地智能问答系统等。主要依托 TensorFlow Lite 与 MediaPipe 框架进行开发与部署。

主流推理框架对比说明

vLLM：社区活跃度高，吞吐性能优于 TGI，兼容更多模型类型，特别适用于高并发请求场景；
TGI（Text Generation Inference）：由 Hugging Face 官方维护，稳定性出色，原生支持 .safetensors 格式，更适合企业级稳定部署；
Ollama：基于 llama.cpp 封装，专注于 GGUF 格式支持，操作简便，是个人开发者快速启动大模型的理想选择。

大模型能力评估体系：如何判断一个模型是否强大？
类似于人类通过考试衡量知识水平，大模型也依赖一套标准化的“测评系统”，从语言基础到综合智能进行全面评估。

1. 基础语言能力测试：困惑度（Perplexity, PPL）
核心作用：评估模型的语言建模基本功，可类比为“语文基础分”，反映其对自然语言结构的掌握程度。
评估逻辑：优质模型会对通顺句子赋予较高预测概率，从而获得较低的困惑度；反之则得分更高。
通俗解释：若困惑度为 2.92，表示模型在预测下一个词时，相当于从约 2.92 个候选词中精准命中目标，数值越低说明模型越自信、越熟练。
适用阶段：主要用于预训练完成后对基座模型的基础能力检验，PPL 越低，后续微调效果通常更优。

2. 文本生成质量评估：BLEU、METEOR、CIDEr
核心作用：衡量生成文本的准确性与流畅性，常用于翻译、摘要、文案生成任务，相当于“写作评分”。

代表性指标：BLEU（Bilingual Evaluation Understudy）
计算原理：基于生成文本与参考文本之间的 N-gram 匹配程度，匹配越多得分越高。
具体步骤：

分别统计 1-gram 至 4-gram 的精确匹配率；
引入“短句惩罚机制”——当生成内容显著短于参考文本时扣分，防止模型偷懒输出过短结果；
将各阶 gram 得分按权重平均（通常每项占 25%），得出最终 BLEU 分数。

案例演示：
原文：“那只猫在垫子上”
生成句：“the cat sat on the mat”
参考句：“the cat is on the mat”
计算结果：
- 1-gram 匹配 5 个词（the, cat, on, the, mat），精确率 5/6
- 2-gram 匹配 3 组（the cat, on the, the mat），精确率 3/5
- 3-gram 匹配 1 组（on the mat），精确率 1/4
- 4-gram 无匹配，得分为 0
最终 BLEU 分数接近零，因最长片段完全不重合。

其他补充指标：

METEOR：引入同义词匹配与词干归一化（如 “run” 与 “running” 视为相关），评估维度比 BLEU 更全面；
CIDEr：侧重关键语义短语的重合度，特别适用于图像描述生成等强调内容覆盖的任务。

3. 综合能力评测：Benchmark 标准化测试
核心作用：模拟“高考 + 职业资格考试”，提供统一标准，实现跨模型公平比较。

三大构成要素：

数据集：公开且标准化的“题库”，包含输入样本与标准答案或标签；
任务定义：明确测试内容类型（如选择题、代码生成、数学推理）及输入输出格式；
评估指标：量化评分规则，如准确率、精确匹配率（Exact Match）、Pass@1 等。

测试名称	核心特点	题型 / 任务类型	评估指标
MMLU	涵盖 57 个学科领域（数学、历史、生物等）	四选一多项选择题	准确率（Accuracy）
CMMLU	覆盖 67 个主题，聚焦中国文化相关内容（古代汉语、法律等）	四选一多项选择题	归一化准确率
HellaSwag	考察常识推理能力，根据情境预测合理结局	四选一结局预测	准确率
BBH	涉及复杂推理任务，需启用“思维链（Chain-of-Thought）”策略	问答与逻辑推理	精确匹配率

实战示例：CMMLU 测评执行命令参数说明
--model：指定所使用的模型后端；
--model_args：设置模型路径或其他初始化参数；
--tasks：定义参与评测的具体任务集合；
--limit：控制评测过程中答题样本的数量上限。

大模型上线流程：部署与实际推理操作指南
经过训练并通过各项评估的模型，需进入实际应用场景——部署即实现“模型可用”的关键环节。

1. 部署目标设定
以 Qwen2.5-3B-Instruct 模型为例，目标是利用 vLLM 推理框架构建 API 接口服务。用户发送请求（例如“撰写一篇口红推广文案”），系统接收并返回生成结果，同时支持高并发访问需求，保障响应效率。

2. 部署前准备：软硬件资源配置
确保服务器具备足够的 GPU 显存与计算能力，安装对应版本的 Python 环境、CUDA 驱动，并完成 vLLM 框架及相关依赖库的配置，确保模型加载与推理过程稳定运行。

硬件配置要求：

GPU 显存：至少 14GB（适用于 Qwen2.5-3B 模型在 FP16 精度下的运行）；
CPU 内存：不低于 32GB；
硬盘空间：预留 ≥20GB，用于存放模型权重文件。

软件环境准备：

操作系统推荐使用 Linux 系统，其中 Ubuntu 为最优选择；
安装 Python 运行环境；
若使用 NVIDIA GPU，需正确配置 CUDA 驱动；
通过命令 pip install vllm 安装 VLLM 推理框架。

部署流程（简化版）

获取模型权重：从 Hugging Face 平台下载 Qwen2.5-3B-Instruct 模型，并保存至本地指定目录（例如：/workspace/example/q）。
启动 VLLM 服务：
```
python -m vllm.entrypoints.api_server --model /workspace/example/qwen --dtype float16 --port 8000
```
参数说明：
- --model：指定模型的本地路径；
- --dtype：设置数据精度，推荐使用 float16，在推理速度与精度之间取得平衡；
- --port：设定服务端口，默认为 8000，可根据需要自定义。

调用 API 接口进行测试：使用 Python 编写请求脚本，向已启动的服务发送请求以调用模型生成内容。

import requests

url = "http://localhost:8000/v1/completions"
headers = {"Content-Type": "application/json"}
data = {
    "model": "Qwen2.5-3B-Instruct",
    "prompt": "写一篇100字左右的口红文案，突出滋润、显白特点",
    "max_tokens": 150,
    "temperature": 0.7  # 0-1，越高越有创造力
}

response = requests.post(url, json=data)
print(response.json()["choices"][0]["text"])

查看输出结果：模型将返回类似如下风格的文本内容：“这支滋润型口红太绝了！丝滑质地一抹上色，牢牢锁住水分，告别干裂唇纹。暖调红棕配色超显白，黄皮也能轻松驾驭，日常通勤、约会都合适，薄涂温柔显气色，厚涂气场全开，让你轻松成为人群焦点～”

部署过程中的注意事项

显存优化策略：当 GPU 显存不足时，可采用量化技术（如 INT8 或 4-bit 量化），有效降低显存占用，但会轻微影响模型输出精度；
并发处理控制：VLLM 框架内置 PagedAttention 技术，能够高效管理 KV Cache，支持较高并发量，建议根据实际 GPU 性能合理调整 batch_size 参数；
系统稳定性保障：对于企业级应用场景，推荐使用 TGI（Text Generation Inference）或 Triton Inference Server，并结合负载均衡机制，提升服务可用性，避免单点故障风险。

大语言模型的发展脉络：从“规则驱动”迈向“智能涌现”

大语言模型的演进并非一朝一夕之功，而是历经四个关键阶段，每一阶段均致力于突破前序技术瓶颈：

1. 基于规则与统计的语言模型（20世纪80年代末 – 21世纪初）

核心技术：依赖人工制定语法规则并结合词频统计方法，典型代表为 N-gram 模型（包括 Unigram、Bigram、Trigram 等）。

面临挑战：存在严重的数据稀疏问题（无法处理未登录词组合），且随着上下文长度增加，参数空间急剧膨胀，导致计算复杂度飙升。

2. 神经网络语言模型（NNLM，2000年代 – 2010年代中期）

核心突破：引入词向量（Word Embedding）机制，将词汇映射为连续数值向量，从而捕捉词语间的语义关联。

显著进步：缓解了数据稀疏性问题，具备一定语义理解能力，例如识别“猫”与“狗”属于同一类别。

遗留局限：上下文窗口固定，难以建模长距离依赖关系，同时训练效率较低。

3. 预训练语言模型（PLM，2018–2020年）

架构革新：采用 Transformer 结构，确立“预训练 + 微调”范式，代表性模型有 BERT、GPT-1 及 GPT-2。

关键优势：泛化能力强，适用于多种自然语言任务，无需针对每个任务单独设计模型结构和从头训练。

4. 大语言模型时代（LLM，2020年至今）

发展特征：以大规模参数量和海量训练数据为基础，展现出“涌现能力”，典型模型包括 GPT-3/4、LLaMA、PaLM 等。

重大飞跃：无需微调即可通过“上下文学习”（In-context Learning）完成新任务，具备推理、创作、代码生成等综合能力，语言表现日趋接近人类水平。

结语：大模型的本质逻辑与未来展望

归根结底，大模型的核心是“数据 + 算力 + 算法”的深度融合——利用海量数据奠定认知基础，依托强大算力支撑模型训练，借助先进算法提升学习效率，并通过人类反馈机制不断校准行为方向。从图像识别到代码编写，从简单问答到复杂逻辑推理，大模型的能力边界正持续扩展，未来发展潜力不可限量。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏0 回帖

关键词：说明书 Transformers Application Generation Completion

相关内容：AI大模型解析 AI模型解析

[其他] AI 超级大脑深度说明书：大模型从 “出生” 到 “上岗” 全解析 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

一、大模型的家族谱系：各有所长的“专业选手”

1. 视觉模型：AI 中的“视觉艺术家”

2. 多模态模型：跨媒介的“通才型选手”

3. 大语言模型（LLM）：自然语言的“文字掌控者”

二、大模型的成长历程：从“初学者”到“专家级”的三阶段进化

1. 预训练阶段：海量数据打基础（无监督 / 自监督学习）

无监督学习：自主发现数据规律

微调（SFT）：面向特定任务的精细化训练

RLHF：基于人类反馈的强化校准

大模型的运行基础：硬件配置、参数规模与存储格式

1. 参数规模：衡量模型能力的关键指标

2. 硬件支撑：驱动模型运行的计算引擎

3. 存储格式：模型权重的组织方式

部署流程（简化版）

部署过程中的注意事项

大语言模型的发展脉络：从“规则驱动”迈向“智能涌现”

1. 基于规则与统计的语言模型（20世纪80年代末 – 21世纪初）

2. 神经网络语言模型（NNLM，2000年代 – 2010年代中期）

3. 预训练语言模型（PLM，2018–2020年）

4. 大语言模型时代（LLM，2020年至今）

结语：大模型的本质逻辑与未来展望

扫码加我拉你入群

相关帖子 AI

浏览过的帖子

浏览过的版块

本版微信群

[其他] AI 超级大脑深度说明书：大模型从 “出生” 到 “上岗” 全解析 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

一、大模型的家族谱系：各有所长的“专业选手”

1. 视觉模型：AI 中的“视觉艺术家”

2. 多模态模型：跨媒介的“通才型选手”

3. 大语言模型（LLM）：自然语言的“文字掌控者”

二、大模型的成长历程：从“初学者”到“专家级”的三阶段进化

1. 预训练阶段：海量数据打基础（无监督 / 自监督学习）

无监督学习：自主发现数据规律

微调（SFT）：面向特定任务的精细化训练

RLHF：基于人类反馈的强化校准

大模型的运行基础：硬件配置、参数规模与存储格式

1. 参数规模：衡量模型能力的关键指标

2. 硬件支撑：驱动模型运行的计算引擎

3. 存储格式：模型权重的组织方式

部署流程（简化版）

部署过程中的注意事项

大语言模型的发展脉络：从“规则驱动”迈向“智能涌现”

1. 基于规则与统计的语言模型（20世纪80年代末 – 21世纪初）

2. 神经网络语言模型（NNLM，2000年代 – 2010年代中期）

3. 预训练语言模型（PLM，2018–2020年）

4. 大语言模型时代（LLM，2020年至今）

结语：大模型的本质逻辑与未来展望

扫码加我 拉你入群

相关帖子 AI

浏览过的帖子

浏览过的版块

本版微信群

扫码加我拉你入群