楼主: 奚_睿
806 1

[咨询文摘] 金融领域事件因果关系抽取的研究(研究现状及相关理论与技术) [推广有奖]

  • 0关注
  • 0粉丝

初中生

61%

还不是VIP/贵宾

-

威望
0
论坛币
1 个
通用积分
0.6663
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
320 点
帖子
9
精华
0
在线时间
7 小时
注册时间
2022-3-27
最后登录
2022-5-24

楼主
奚_睿 发表于 2022-4-24 08:23:30 来自手机 |只看作者 |坛友微信交流群|倒序 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
研究现状
  因果句确定后,如何抽取原因部分和结果部分,是因果事件抽取的基础。因果事件中事件实体表示是一个开放的问题,针对不同应用场景可以有不同的表示方式。因果事件中事件实体的表示方法主要有:基于词性的词袋表示和基于语义的元组表示。
  如何表示因果事件,需根据具体研究问题的特点决定。对于财经文本中的因果事件实体,同样需要明确动作的执行者、动作作用的对象和动作使用的工具/方法,这些是因果事件实体的固有属性,因此本项目中的因果事件拟采用基于语义的元组表示方法,以便保留尽可能多的重要信息;同时,还需要在因果事件的元组表示中增加事件动作的极性,因为因果事件动作的极性可用于识别因果事件象之间约束关系的类型。
  目前,语义角色标注都是在寻找合适的特征,而对于结构比较复杂的句子,如并列结构、子句等,仅仅依靠一些特征进行语义角色标注,依然存在由于句子结构复杂而带来的标注错误问题。在财经文本中,因果句的原因部分和结果部分经常会出现多个名词短语的并列结构,或连续多个动词引导的多分支结构,因此,在语义角色标注之前,有必要对句子进行因果部分切分、事件实体修正,并列结构分解。

信息抽取简介
   信息抽取是自然语言处理领域中的一个重要的研究内容。信息抽取是指从非结构化或半结构化文档中提取结构化信息的技术。信息抽取的关键任务包括命名实体识别(Named Entity Recognition,NER),指代消解(Reference Resolution,RR)关系抽取(Relation Extraction,RE)和事件抽取(Event Extraction,EE)。
1) 命名实体识别
   命名实体识别旨在从文本中识别出语义类别已被定义的对象,这些类别如人名、地址、组织机构名称等。命名实体识别不仅仅是独立的信息抽取任务,它在信息检索、自动文本概要、智能问答、机器翻译以及知识建库(知识图谱)等自然语言处理应用领域中也扮演了重要的角色。
2) 指代消解
   指代消解技术主要用于解决多个指称对应同一实体对象的问题。在一次会话任务中,多个指称可能指向的是同一实体对象。利用共指消解技术,可以将这些指称项关联(合并)到正确的实体对象,由于该问题在信息检索和自然语言处理等领域具有特殊的重要性,吸引了大量的研究努力。共指消解还有一些其他的名字,比如对象对齐、实体匹配和实体同义。
3) 关系抽取
   关系抽取通常在命名实体抽取之后。在识别出句子中的关键实体后,还需要抽取两个实体或多个实体之间的语义关系。语义关系通常用于连接两个实体,并与实体一起表达文本的主要含义。
4) 事件抽取
   事件抽取技术是从非结构化信息中抽取出用户感兴趣的事件,并以结构化呈现给用户。事件抽取任务可分解为 4 个子任务:触发词识别、事件类型分类、论元识别和角色分类任务。其中,触发词识别和事件类型分类可合并成事件识别任务。事件识别判断句子中的每个单词归属的事件类型,是一个基于单词的多分类任务。论元识别和角色分类可合并成论元角色分类任务。角色分类任务则是一个基于词对的多分类任务,判断句子中任意一对触发词和实体之间的角色关系。

关联规则挖掘简介
   计算机技术与数据库技术的发展得越来越快,数据资源越来越多。数据的规模虽然越来越大,但是并没有落实到信息需求问题,因此,产生了大规模数据集的数据挖掘技术。相较于传统技术,数据挖掘技术是一种新型的信息处理技术,能够自动和智能的从大量数据中挖掘出潜在信息,转换成人们需要的信息和知识。它可以从数据集中提取有用的知识、规律以及更高层次的信息,对此进行分析,帮助人们发现海量数据中存在的潜在价值。目前对数据挖掘的发展趋势及研究方向主要集中在数据挖掘的数据集成、分类、聚类、关联规则等方面。而关联规则挖掘作为数据挖掘的核心内容之一,近年得到了很快的发展。并已经成为当今数据挖掘的热点。
   关联规则作为数据挖掘的核心研究内容之一,它是大量数据中发现信息之间可能存在的某种关联或者相关联系。通过分析这些挖掘出的数据联系,可以在现实中帮助我们预测或决定某些事情将会发生,辅助决策。当前,关联规则挖掘技术广泛应用于金融、互联网、医学等多个领域。最早的关联挖掘是发现交易数据库中不同商品之间的联系。通过分析这种联系获得有关购买者的一般的购买模式,帮助商家合理地安排进货、库存及货架设计,更好的制定发展计划和风险控制。
   关联规则是通过形如 X—>Y 的一种蕴涵式表达的,其中 X 和 Y 是不相关的项集,(X,Y)∈I,有 X∩Y=NULL 成立。关联规则强度可用支持度和置信度进行评价度量。支持度表示规则可以用于给定数据集的频繁程度,而置信度表示 Y 在包含 X 的事物中出现的频繁程度。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:金融领域 因果关系 相关理论 研究现状 Recognition

沙发
三重虫 发表于 2022-4-27 20:04:58 |只看作者 |坛友微信交流群

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-1 15:20