人大经济论坛 › 论坛 › 提问悬赏求职新闻读书功能一区 › 经管文库（原现金交易版） › UltraSafety 大模型安全评价数据集 3000 条有害指令 + G ...

发帖

楼主: ewfwedwd

96 0

腾讯 [推广有奖]

0关注
1粉丝

已卖：447份资源

学科带头人

31%

还不是VIP/贵宾

威望: 0 级
论坛币: 1363 个
通用积分: 457.0553
学术水平: 1 点
热心指数: 1 点
信用等级: 1 点
经验: 13630 点
帖子: 1006
精华: 0
在线时间: 279 小时
注册时间: 2022-11-18
最后登录: 2026-4-17

楼主

ewfwedwd 发表于 2025-12-30 16:01:12 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

UltraSafety 大模型安全评价数据集由中国人民大学、清华大学与腾讯联合打造，专注于大模型安全评估与风险防范能力提升，是科研机构、AI 企业进行大模型安全训练的核心工具。

1. 数据集核心构成

指令规模：总计 3000 条有害指令，含 1000 条源自 AdvBench 和 MaliciousInstruct 的安全种子指令，2000 条通过 Self-Instruct 引导生成的拓展指令；

特色资源：手动筛选 AutoDAN 中的 830 条高质量越狱提示，每条有害指令均配套对应越狱场景；

评级标准：附带 GPT4 权威评级（1 级 = 无害，0 级 = 有害），标注不同安全级别模型的生成结果，数据标注精准可直接用于模型训练。

2. 适用场景与使用途径

适用人群：大模型安全领域研究者、AI 算法工程师、高校科研团队、AI 企业产品研发人员；

核心用途：辅助训练大模型有害指令识别能力、越狱攻击防范机制、安全风险评估体系搭建；

获取方式：下载压缩包（304 Bytes），支付 10 元即可获取完整数据集，直接用于科研实验、模型优化、学术论文数据支撑等场景。

3. 数据集核心优势

权威背书：名校 + 头部企业联合创建，数据来源合规、标注专业；

场景全覆盖：覆盖有害指令生成、越狱攻击模拟、安全等级评估等核心场景；

即拿即用：结构化数据格式，配套评级标签与生成结果对照，无需额外预处理。

UltraSafety 大模型安全评价数据集.zip (304 Bytes, 需要: RMB 10 元)

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏0 回帖

关键词：Safety Ultra Rasa Safe RAS 大模型安全数据集、UltraSafety 数据集、大模型安全评估、AI 大模型风险防范、大模型安全科研数据、GPT4 评级数据集、AdvBench 衍生数据集、有害指令识别、越狱提示数据集、模型安全训练数据

返回列表

发帖

本版微信群

扫码
拉您进交流群

京ICP备16021002号-2 京B2-20170662号京公网安备 11010802022788号论坛法律顾问：王进律师知识产权保护声明免责及隐私声明

[经管数据集] UltraSafety 大模型安全评价数据集 3000 条有害指令 + GPT4 评级人大 / 清华 / 腾讯 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我拉你入群

浏览过的帖子

浏览过的版块

本版微信群

[经管数据集] UltraSafety 大模型安全评价数据集 3000 条有害指令 + GPT4 评级 人大 / 清华 / 腾讯 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我 拉你入群

浏览过的帖子

浏览过的版块

本版微信群

[经管数据集] UltraSafety 大模型安全评价数据集 3000 条有害指令 + GPT4 评级人大 / 清华 / 腾讯 [推广有奖]

扫码加我拉你入群