2025年CCF中国软件大会“智能化研发智能体技术”论坛于11月28日上午在武汉国际会议中心二楼荆沁厅205顺利举行。本次论坛由华为云数字化平台技术创新Lab的王千祥、梁广泰、边攀等专家联合视界引擎CTO申博共同发起并组织,吸引了来自全国各地超过200名从事智能研发领域的专家学者、高校师生及科研人员积极参与。
论坛围绕研发智能体技术的核心议题展开深入交流,邀请了多位业内权威学者作专题报告,包括天津大学陈俊洁教授、北京航空航天大学高祥副教授、中山大学王焱林助理教授、中国科学院软件研究所孙泽宇副研究员以及华为边攀博士。会议最后还设置了Panel讨论环节,聚焦研发智能体在企业实际应用中所面临的挑战与未来潜在的研究方向。
专题报告部分由华为云数字化平台技术创新Lab软件安全团队负责人边攀博士主持,内容涵盖开场致辞及五场高质量学术报告。
论坛伊始,华为云智能研发首席专家王千祥博士发表开幕致辞。他指出,当前AI辅助软件开发的重点正从单一的大模型能力突破,逐步转向以大模型为核心的智能体系统构建。在此背景下,软件工程领域应主动迎接变革,推动研发智能体的技术创新与实践落地,尤其要在提升代码生成的可控性、可靠性方面做出实质性贡献。
随后,天津大学陈俊洁教授带来了题为“基于需求对齐的大模型代码生成技术”的报告。他强调,需求描述是代码生成的起点,而大语言模型(LLM)对用户需求的语义理解、意图识别和细节把握,直接决定了输出代码的质量。然而,现有模型在面对需求歧义、上下文缺失或语义偏差时,常产生偏离预期的结果。为此,陈教授提出从“需求对齐”角度优化代码生成流程,具体路径包括需求解析、语义映射和对齐反馈机制。通过使模型的理解过程与人类真实意图保持一致,可显著增强生成代码的准确性与实用性,为智能化软件开发提供更坚实的基础。
北京航空航天大学高祥副教授以“代码属性驱动的智能化研发”为主题进行了分享。他指出,当前基于大语言模型的智能软件工程方法依赖自然语言交互,存在模糊性强、难以满足程序精确语义要求的问题,导致生成代码在逻辑和语义层面易出现缺陷。针对这一瓶颈,研究团队提出了“代码属性驱动”的新范式,即将程序中的结构化语义属性——如数据类型、接口规约、程序不变式等——系统性地引入模型推理与生成过程,实现高层设计意图与底层实现之间的精准衔接。
该方法已在多个关键任务中取得进展:在测试用例生成中,利用属性匹配检索相关案例以提高覆盖率;在漏洞检测中,借助属性表征语义信息辅助缺陷定位;在代码生成中,则通过属性约束提升输出正确率。这一路径有效增强了模型对程序语义的理解能力,推动智能研发工具向更高可靠性与更强泛化性能发展,为软件工程与人工智能深度融合开辟了新的技术方向。
中山大学王焱林助理教授作了题为“浅谈工程级代码生成、翻译与问题解决”的报告,聚焦智能体时代下软件工程中的核心应用场景。他系统探讨了仓库级代码生成、跨语言代码翻译以及复杂问题求解等方面的前沿研究与实践成果。在代码生成方面,分析了智能体如何根据实际需求高效产出高质量代码;在代码翻译领域,讨论了整仓库迁移的难点、评测集构建方法以及基于智能体的自动化翻译方案;在问题解决方面,介绍了多语言、多模态统一评测基准OmniGIRL的设计理念与应用价值。
最后,他对智能体在工程级软工任务中的落地现状进行总结,并提出几点思考:环境配置可能是制约LLM应用于软件工程的主要障碍之一;当前模型尚不具备自主挖掘仓库内有用信息的能力;需要进一步完善面向软件工程的大规模高质量数据集建设;同时,更通用、即插即用的智能体架构将更有利于技术转化与实际部署。
中国科学院软件研究所孙泽宇副研究员围绕“自动化提升代码生成效果的提示优化方法”展开报告,重点回应了当前大语言模型在代码生成任务中对高质量Prompt高度依赖、人工编写难以持续保障效果稳定的问题。他指出,传统手工构造的提示词往往无法兼顾模型偏好与代码规范性要求,在真实开发场景中容易导致输出风格不一、质量波动等问题,因此亟需一种能够自动构建并持续优化Prompt的技术框架。
为此,研究团队提出了Prochemy方法——一种面向代码生成任务的自动化Prompt优化体系,具备“自动化”与“可兼容”两大核心特性,旨在通过系统化的迭代机制动态调整提示内容,从而提升模型输出的稳定性与实用性。
Prochemy 采用从零样本 Prompt 出发的策略,通过任务数据自动生成训练样本,并在此基础上实施多轮迭代优化。该过程涵盖 Prompt 变异、结果评估、加权评分与优胜者选择等关键环节,使模型能够在持续反馈中逐步逼近最优提示配置。在实验验证阶段,该项目在多个主流代码生成与翻译基准数据集上进行了系统性测试,包括 HumanEval、MBPP、LiveCodeBench 和 CodeNet,覆盖了 GPT-3.5、GPT-4o、Claude、DeepSeek 等多种大语言模型(LLM)。对比方案不仅包含 APE、OPRO 等单轮优化方法,也引入了 AgentCoder、CodeCoT 等多轮自协作机制。
实验结果显示,Prochemy 在各类基准测试中实现了平均 4% 至 8% 的性能提升,充分验证了其在不同模型和任务场景下的普适性与有效性。同时,研究还进一步展示了 Prochemy 在推理型模型(如 o1-mini)上的应用表现,表明其即使在面对复杂推理需求时,依然具备显著的优化潜力。
在本次论坛中,华为云数字化平台技术创新Lab的边攀博士分享了题为《项目级智能化软件研发智能体技术实践》的主题报告。报告指出,项目级研发智能体(DevAgent)构建于“模型+工具+知识+环境”四位一体的技术架构之上,融合了代码仓库理解、知识图谱构建、经验复用机制以及工具链深度集成等多项底层能力。依托“语义理解+检索增强+内容生成”的技术路径,该智能体能够自主完成从需求分析、代码编写到测试验证及缺陷修复的完整流程,实现由单一任务辅助向项目级全流程自动化研发的跃迁。
目前,部分核心技术已在实际场景中落地并取得显著成效:基于领域知识驱动的代码生成方案大幅提升了客户前端代码的准确率与采纳率;针对静态告警的修复智能体在真实项目中实现超过85%的识别准确率,累计自动处理告警数量逾300万条,显著提高修复效率;在智能体支持下的测试工具所生成的单元测试用例,其可编译率显著提升,达到行业领先水平,并获得最高评级认证,有效支撑了跨行业项目的高效交付。
本次论坛特别设置了Panel讨论环节,由华为云数字化平台技术创新Lab主任梁广泰博士(左一)主持。参与对话的嘉宾包括中国科学院软件研究所孙泽宇副研究员(左二)、华为云数字化平台技术创新Lab边攀博士(左三)、华为云智能研发首席专家王千祥(右三)、北京航空航天大学高祥副教授(右二),以及天工开物开源基金会执行副秘书长庄表伟(右一)。围绕研发智能体的核心价值与发展影响、工业级规模化落地的关键挑战与路径、未来校企协同创新的合作模式等议题,嘉宾们展开了深入交流与思想碰撞。
随着大语言模型技术的不断成熟,传统软件开发范式正面临根本性重构。AI 已不再局限于作为应用中的功能组件,而是逐渐演变为贯穿整个软件生命周期的核心驱动力。本次技术论坛聚焦“研发智能体”这一智能化开发的关键方向,深入探讨如何更有效地整合与利用大语言模型的能力,推动新一代智能软件系统及其配套工具链与方法论的构建。
论坛汇聚了来自学术界与产业界的多位权威专家,面向现场200余名观众全面呈现了当前研发智能体领域的前沿研究成果与实践经验。通过高质量的技术分享与互动交流,不仅激发了智能开发从业者的科研热情,也有助于加强国内相关研究团队之间的协作联动,为后续技术研发与生态建设注入新动能。


雷达卡


京公网安备 11010802022788号







