楼主: Lyon0898
241 0

SocialMaze 逻辑推理基准数据集 [推广有奖]

  • 0关注
  • 7粉丝

已卖:4910份资源

院士

45%

还不是VIP/贵宾

-

威望
0
论坛币
146451 个
通用积分
15193.5847
学术水平
55 点
热心指数
57 点
信用等级
55 点
经验
46563 点
帖子
1891
精华
0
在线时间
443 小时
注册时间
2022-3-14
最后登录
2026-1-30

楼主
Lyon0898 在职认证  发表于 2025-10-31 18:15:30 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

SocialMaze 是一个社会推理基准数据集,聚焦于多智能体交互场景下的隐藏角色推理任务,旨在评估大型语言模型(LLMs)在复杂社交环境中的逻辑推理、欺骗识别和多轮对话理解能力。为研究 LLMs 的社会推理能力提供了标准化测试平台。

该数据集围绕隐藏角色推理游戏设计,模拟含欺骗与误判的社交场景:

角色设定:调查员(Investigator):始终提供真实陈述。罪犯(Criminal):可选择性撒谎,混淆视听。谣言传播者(Rumormonger):自认为是调查员,但陈述随机真假。疯子(Lunatic):自认为是罪犯,陈述随机真假。游戏流程:每局包含 3 轮对话,每轮所有玩家公开指认某一玩家是否为罪犯。玩家 1(即模型视角)需根据三轮对话记录,推断真正的罪犯及自身真实角色(可能为上述四种之一)。

核心挑战是区分真实陈述与随机谎言,处理角色自我认知偏差(如谣言传播者和疯子的错误身份认知),通过多轮对话中的逻辑矛盾或一致性,逐步排除不可能选项,锁定唯一解。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Social Maze 逻辑推理 LMA CIA

SocialMaze.rar
下载链接: https://bbs.pinggu.org/a-8586072.html

2.34 KB

需要: 101 个论坛币  [购买]

磁力链接,169M

本附件包括:

  • SocialMaze.torrent

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-2-3 04:08