一、政策背景与大模型备案制度概述
根据《生成式人工智能服务管理暂行办法》(以下简称《暂行办法》),我国建立了针对生成式人工智能(AIGC)服务的大模型备案机制。该制度主要面向具备舆论属性或社会动员能力的AI服务,通过安全评估和合规审查,防范数据泄露、算法歧视及内容违规等风险,力求在推动技术创新的同时保障公共安全。
自2023年8月《暂行办法》实施以来,截至2025年3月,全国已有346家大模型通过备案;若计入2025年4月和5月部分省份陆续公布的名单,总数已突破400家。相较算法备案而言,大模型备案在审批数量上更少、周期更长,反映出其更高的准入门槛与更严格的审核标准。
政策亮点:
- 全球首个AIGC专项法规:中国是全球第一个出台专门规范生成式人工智能服务管理规定的国家。采用“备案制”而非“审批制”,既降低了企业进入市场的初始障碍,又通过持续监管确保服务安全性。
- 分类分级治理模式:仅对直接面向公众并具有较强社会影响力的生成式AI服务实行备案管理;而对于技术接口(API)调用类场景,则采取登记备案方式,体现灵活、差异化的监管思路。
二、备案主体范围与基本条件
适用对象包括两类主体:
- 平台运营方:负责商业化落地与市场推广的企业实体,如百度、商汤等。
- 技术支持方:专注于算法研发的技术机构或科研院所。
备案需满足三大核心要件:
- 合法主体资格:申请单位须为在中国境内依法注册的法人或其他组织;若为外资企业,还需符合现行外商投资准入相关规定。
- 完成前置算法备案:依据《互联网信息服务算法推荐管理规定》,必须先取得算法推荐服务的备案证明。
- 内容输出合规:模型生成内容应遵守国家法律法规,不得传播违法不良信息,且需符合主流意识形态要求。
三、备案流程与所需材料清单
典型省级备案流程如下:
- 提交申请:向所在地网信部门提出备案请求,领取备案表格,并接受初步咨询与指导。
- 准备材料并开展自测:
- 技术文档:涵盖模型架构设计、训练框架说明、算力资源配置情况等内容。
- 安全评估报告:包括语料来源合法性验证(如数据采集协议、版权授权文件)、生成内容安全性测试结果(如关键词拦截清单、多模态测试题集)。
- 服务协议:明确用户隐私保护机制、内容过滤策略以及突发事件应急响应方案。
- 审核与实测阶段:
- 省级初审:重点核查申报材料完整性及语料使用的合规性。
- 中央终审:进行技术性能与安全能力测试,例如生成内容抽样合格率不低于95%,非法内容拒答率达到98%以上。
- 公示与上线运营:获得备案编号后,须在产品界面显著位置展示备案信息,并接受后续不定期抽查。
| 材料类型 | 内容要点 | 重要性评级 |
|---|---|---|
| 大模型基本情况 | 模型名称、功能描述、目标用户群体、服务覆盖范围 | 核心 |
| 语料来源证明 | 数据采集合同、版权合法性文件、第三方授权凭证 | 核心 |
| 安全自评估报告 | 语料安全处理流程、生成内容潜在风险分析、应急管理预案 | 核心 |
| 拦截关键词列表 | 包含违法、敏感、歧视性及其他禁止传播的词汇集合 | 高 |
| 多模态评估测试题集 | 用于文本、图像、视频等多种形式生成内容的安全性测试案例 | 高 |
四、关键技术要求与合规重点
1. 数据安全管理
- 全流程控制:从数据采集环节建立审批机制,到训练过程中使用数据沙箱隔离环境,确保各阶段操作均符合法律法规要求。
- 语料清洗处理:剔除含有违法、有害或偏见的内容。据艾瑞咨询统计,头部企业在预训练前的语料清洗比例可达30%。
2. 算法透明度提升
- 系统填报公开:需在备案系统中如实填写算法运行机制、风险防控措施,接受社会监督。
- 可解释性评估:提供模型决策逻辑说明,减少因“黑箱”效应引发的信任危机。
3. 生成内容管控机制
- 多层次过滤体系:结合提示词筛查、实时内容拦截与事后人工复核机制(如蚂鉴AI安全检测平台),实现全链路内容把关。
- 显著标识义务:所有由AI生成的内容必须标注“由AI生成”字样,增强用户辨识度。
五、备案后的持续监管与违规后果
常态化监管手段包括:
- 年度现场检查:网信部门每年至少组织一次实地核查,重点关注语料更新记录、内容生成日志等关键证据。
- 重大变更重新评估:当模型发生结构性升级(如新增图像生成能力)时,需重新提交安全评估材料。
违反备案规定的处罚措施:
- 行政处罚:视情节轻重给予警告、责令整改、罚款,严重者将被暂停服务资格。
- 刑事责任:若生成内容涉及诈骗、煽动分裂等犯罪行为,相关责任人可能面临刑事追责。
- 商业层面影响:未完成备案的产品无法上架主流应用商店;已上线服务则存在下架风险,进而导致用户流失、融资困难等问题。
六、典型案例分析与行业发展趋势
代表性备案进展:
- 首批备案(2023年8月):百度“文心一言”、商汤“SENSECHAT”等8款模型获批,标志着我国AIGC监管框架正式落地实施。
- 第四批备案(2024年2月):小米“小爱助手”、第四范式“式说”等14款新模型通过,首次出现同一企业拥有两个备案模型的情况,反映出市场竞争加速。
行业影响体现为:
- 形成数据飞轮效应:已备案企业可合法收集用户反馈数据,用于迭代优化模型性能,构建竞争壁垒。
- 市场集中度上升:头部企业凭借资金、技术和合规优势抢占先机,中小开发者面临更高准入门槛。
- 垂直领域深化应用:京东“言犀”聚焦零售场景,云知声“山海”服务于医疗健康领域,专用型大模型逐步通过备案,推动行业智能化解决方案落地。
七、备案工作建议
- 提前规划时间线:从材料准备到最终获批平均耗时4至7个月,建议尽早启动,协调法务与技术团队协同推进。
- 优先选用合规API服务:对于中小型机构,可考虑接入已备案大模型的开放接口,降低独立申请成本与技术压力。
- 建立内部安全监控机制:组建专业的内容安全部门,定期维护关键词库、更新测试题集,确保长期合规运营。


雷达卡


京公网安备 11010802022788号







