楼主: 2019hansi
1366 4

[生活哲学] 面向知识图谱的信息抽取 [推广有奖]

  • 3关注
  • 4粉丝

等待验证会员

院士

46%

还不是VIP/贵宾

-

威望
0
论坛币
14 个
通用积分
86.6097
学术水平
0 点
热心指数
1 点
信用等级
0 点
经验
40511 点
帖子
1777
精华
0
在线时间
816 小时
注册时间
2019-6-4
最后登录
2025-12-31

楼主
2019hansi 发表于 2020-10-14 09:20:42 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
随着计算机技术和互联网的飞速发展和知识互联时代的到来,人们期寄着构建一个更加智能的、机器可理解可计算的万维网。知识图谱的概念逐渐出现在人们视野中。知识图谱在语义处理、开放处理等功能方面都显现出很强的能力,在智能推荐、问答和对话系统以及大数据分析和决策等应用中也体现出越来越重要的价值。知识图谱预计将在互联网知识互联的实现过程中起到中流砥柱的作用。

在汉斯出版社《数据挖掘》期刊中,有论文首先以知识图谱的构建框架为背景。探讨信息抽取研究的意义;然后从MUC、ACE和ICDM三个国际测评会议的角度回顾信息抽取的发展历史;接着,基于面向限定域和开放域两个方面,介绍信息抽取的关键技术,包括实体抽取技术、关系抽取技术和属性抽取技术。

信息抽取系统是一种从大量信息源中迅速抛开无效信息找到有用信息的信息获取工具。信息抽取通常从两方面进行实现:一类是基于知识发现和数据挖掘的方法,通常处理结构化、半结构化的数据;另一类是基于自然语言处理和文本挖掘的方法,通常处理非结构化数据。信息抽取的具体方法可分为三类:第一类是基于规则(基于专家系统)的方法。主要在早期使用,使用人工编制规则,存在效率低,系统可移植性差等不可忽视的局限性;第二类是基于统计的方法,可在一定程度弥补第一类方法的缺点;第三类是基于机器学习的方法,,它大幅减少了人工干预,并具有处理新文本的能力,是目前常用的方法。

本文首先根据知识图谱的概念、构建技术框架引出了信息抽取的概念,接着通过三个国际评测会议介绍了信息抽取的发展历史;后续详细介绍了信息抽取关键技术,包括实体抽取、关系抽取和属性抽取;最后分析了信息抽取的研究趋势。我们系统性分析了面向知识图谱信息抽取的常用方法,根据技术特点分为实体抽取、关系抽取以及属性抽取三类子任务。其中各个子任务根据其应用领域分为面向特定领域和面向开放域两种,根据其数据来源分为面向文本和面向Web两种。

在面向特定领域的情境下,信息抽取各个子任务的技术方法较成熟、经典,例如在实体抽取中常用CRF、ME、HMM、NN-CRF等基于统计的模型;在关系抽取中常使用基于监督、半监督或无监督的机器学习方法。

在面向开放领域的应用中,随着大数据时代、全网时代的到来,更多新的优秀的方法正在不断地涌现。具体地,在实体识别任务中,出现了一些基于自学习方法的实体分类模型,从而不再需要通过人工构造大量语料标注、大量的特征;在关系抽取中,出现了以OIE框架为基础的众多优秀系统,基本实现了各种词性间的关系抽取以及隐含关系的抽取。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:研究的意义 结构化数据 计算机技术 大数据时代 学习的方法

沙发
shijls 学生认证  发表于 2022-11-27 21:21:31
这是出自哪一篇文章呀,求出处?

藤椅
2019hansi 发表于 2022-12-2 09:30:29

板凳
三江鸿 发表于 2022-12-4 19:36:57
点个赞感谢分享

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-3 12:49