《金融大模型国产化信创适配项目》概述
本项目致力于打造一套全栈自主、安全合规且以实际业务场景为导向的金融行业大模型私有化解决方案。方案以同花顺自主研发的HiThinkGPT系列金融垂直领域大模型为核心驱动引擎,结合一体化的大模型管理平台与低代码智能体开发环境,为金融机构提供涵盖底层算力支撑、模型服务调度到上层智能化应用落地的完整技术链路。
系统深度兼容以华为昇腾为代表的国产信创技术生态,在确保满足金融级安全性与监管合规要求的同时,具备强大的业务赋能能力与持续创新能力,助力机构实现AI能力的自主可控建设。
核心架构设计
项目整体由三大核心组件构成,形成“模型—平台—应用”闭环的技术体系:
1. 大模型基座
定位:作为整个系统的智能中枢,提供面向具体金融任务优化的模型服务能力。
描述:包含多个针对不同应用场景(如风险控制、客户服务、投资研究、文档理解等)专项调优的闭源大模型,参数规模覆盖1B至72B,支持最长128K上下文长度,兼顾轻量化部署与复杂推理需求。
关键模块:HiThinkGPT系列风控模型、客服模型、推理增强模型、通用语言模型;集成大模型推理加速技术,提升响应效率。
2. 大模型管理平台(私有化版本)
定位:扮演模型生命周期管理的“操作系统”角色。
描述:提供从模型部署、调试、训练、评估到运行监控的全流程管理能力,并融合容器化、资源调度等云原生基础设施功能,保障企业级AI服务的高效、稳定与可控运维。
关键模块:模型服务管理、数据集治理、Prompt工程工具、训练与评测系统、资源使用监控、基于算力/应用/集群维度的容器化资源管控。
3. 智能体工坊(同创工坊)
定位:实现业务价值转化的“创新工厂”。
描述:一个低代码的AI智能体开发平台,整合大模型能力、金融专业数据与标准化插件,支持业务人员通过可视化流程编排,快速构建并上线适用于营销推广、投资顾问、研报生成、合规审查等场景的AI助手,显著降低AI应用开发门槛。
关键模块:Agent配置中心、图形化工作流编辑器、知识库管理系统、官方预置插件与智能体模板、自然语言取数组件、配套运营支持服务包。
信创部署与资源配置方案
项目提供灵活可选、性能可量化的硬件部署路径,重点强化对国产信息技术创新生态的全面适配。
双技术路线支持
推荐方案:华为昇腾信创一体机
基于华为Atlas 800I A2推理服务器(搭载昇腾910B NPU及鲲鹏CPU),构建从硬件整机到软件模型全面适配的端到端信创体系,保障核心技术自主可控,供应链安全可靠。
备选方案:英伟达通用GPU平台
采用A100、H20、L20等国际主流GPU设备,作为高性能对比选项,适应不同客户现有的IT基础设施条件,提供灵活过渡路径。
性能与配置量化指标
部署方案中明确列出多种大模型(包括DeepSeek、HiThinkGPT系列)在两类硬件平台上的具体资源配置、量化精度以及关键性能表现,如系统吞吐量、并发处理能力、首Token延迟等,帮助客户依据自身业务体量、响应要求和预算进行科学选型。
例如,在信创环境下,32B级别的模型于昇腾910B平台上可达到136 Token/s的系统吞吐速率。
项目优势与核心价值
全栈信创,安全合规
模型自主研发,平台软件完全自主可控,深度对接华为昇腾国产算力底座,符合金融行业在数据隐私保护、模型行为可管可控以及信创验收方面的严格标准。
场景深耕,开箱即用
提供覆盖风控、客服、投研、营销等多个高价值场景的预训练金融大模型,配套超过20个预置智能体模板,并集成同花顺实时金融数据接口,能够快速嵌入现有业务流程,缩短AI价值落地周期。
平台赋能,持续运营
依托大模型管理平台实现模型的高效迭代与稳定运维,借助智能体工坊降低后续AI应用开发复杂度,同时提供从技术实施到运营指导的全周期服务支持,确保系统不仅“建得成”,更能“用得好、走得远”。
架构开放,灵活扩展
平台支持接入多种内部或外部大模型,提供标准API接口与丰富的插件生态体系,便于金融机构基于自有数据资产和业务逻辑开展定制化开发,实现能力的按需延展与深度融合。
综上所述,该项目不仅是单一的技术产品交付,更是一套助力金融机构在信创背景下系统性构建AI核心能力的整体解决方案。它从技术自主性、业务贴合度、运营可持续性三个关键维度出发,为客户应对智能化升级与信创替代双重挑战提供了坚实的技术支撑与实践路径。



雷达卡



京公网安备 11010802022788号







