楼主: ewfwedwd
24 0

[经管数据集] UltraSafety 大模型安全评价数据集 3000 条有害指令 + GPT4 评级 人大 / 清华 / 腾讯 [推广有奖]

  • 0关注
  • 1粉丝

已卖:411份资源

学科带头人

1%

还不是VIP/贵宾

-

威望
0
论坛币
1258 个
通用积分
456.3803
学术水平
1 点
热心指数
1 点
信用等级
1 点
经验
10160 点
帖子
859
精华
0
在线时间
201 小时
注册时间
2022-11-18
最后登录
2025-12-31

楼主
ewfwedwd 发表于 2025-12-30 16:01:12 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

UltraSafety 大模型安全评价数据集由中国人民大学、清华大学与腾讯联合打造,专注于大模型安全评估与风险防范能力提升,是科研机构、AI 企业进行大模型安全训练的核心工具。



1. 数据集核心构成

指令规模:总计 3000 条有害指令,含 1000 条源自 AdvBench MaliciousInstruct 的安全种子指令,2000 条通过 Self-Instruct 引导生成的拓展指令;

特色资源:手动筛选 AutoDAN 中的 830 条高质量越狱提示,每条有害指令均配套对应越狱场景;

评级标准:附带 GPT4 权威评级(1 = 无害,0 = 有害),标注不同安全级别模型的生成结果,数据标注精准可直接用于模型训练。



2. 适用场景与使用途径

适用人群:大模型安全领域研究者、AI 算法工程师、高校科研团队、AI 企业产品研发人员;

核心用途:辅助训练大模型有害指令识别能力、越狱攻击防范机制、安全风险评估体系搭建;

获取方式:下载压缩包(304 Bytes),支付 10 元即可获取完整数据集,直接用于科研实验、模型优化、学术论文数据支撑等场景。



3. 数据集核心优势

权威背书:名校 + 头部企业联合创建,数据来源合规、标注专业;

场景全覆盖:覆盖有害指令生成、越狱攻击模拟、安全等级评估等核心场景;

即拿即用:结构化数据格式,配套评级标签与生成结果对照,无需额外预处理。




UltraSafety 大模型安全评价数据集.zip (304 Bytes, 需要: RMB 10 元)



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Safety Ultra Rasa Safe RAS 大模型安全数据集、UltraSafety 数据集、大模型安全评估、AI 大模型风险防范、大模型安全科研数据、GPT4 评级数据集、AdvBench 衍生数据集、有害指令识别、越狱提示数据集、模型安全训练数据

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-1 18:58