楼主: 张杰2026
5438 5

知识图谱的最新进展、关键技术和挑战 [推广有奖]

  • 0关注
  • 0粉丝

硕士生

36%

还不是VIP/贵宾

-

威望
0
论坛币
21 个
通用积分
8.9992
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
2216 点
帖子
79
精华
0
在线时间
59 小时
注册时间
2014-3-26
最后登录
2024-6-27

楼主
张杰2026 发表于 2021-11-21 13:08:40 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

随着知识的不断积累和科学的飞速发展,人类社会进行了多次改变社会结构的重大生产力革命。最近的生产力革命正是由Web技术发展引发的信息革命。伴随着Web技术不断地演进与发展,人类即将迈向基于知识互联的崭新“Web3.0”时代[

图  1  知识图谱的技术架构
Figure  1.  Architecture of the Knowledge Graph



下载: [url=]全尺寸图片[/url] [url=]幻灯片[/url]



实体抽取也称为命名实体识别,主要目标是从样本源中识别出命名实体。实体是知识图谱最基本的元素,实体抽取的完整性、准确率、召回率将直接影响知识图谱的质量[12]。文献[19]将实体抽取的方法归纳为3种:(1)基于规则与词典的方法。通常需要为目标实体编写相应的规则,然后在原始语料中进行匹配,Quimbaya等[20]提出了一个基于词典的实体抽取方法,并应用于电子健康记录。(2)基于统计机器学习的方法。主要利用数据来对模型进行训练,然后再利用训练好的模型去识别实体,Liu等[21]将K近邻(K-nearest neighbors,KNN)算法和线性条件随机场(Conditional random fields,CRF)模型结合来识别实体。(3)面向开放域的抽取方法。主要是针对海量网络数据,Jain与Pennacchiotti[22]提出通过已知实体的语义特征来识别命名实体,并提出实体聚类的无监督开放域聚类算法。Zhang与Elhadad[23]提出一个无监督的实体抽取方法,利用术语、语料库统计信息以及浅层语法知识从生物医学中抽取实体。

通过实体抽取获取的实体之间往往是离散且无关联的。通过关系抽取,可以建立起实体间的语义链接。关系抽取技术主要分为3种:(1)基于模板的关系抽取。使用模板通过人工或者机器学习的方法抽取实体关系,虽然准确率高且针对性强,但是其也具有不适用于大规模数据集、低召回率、难以维护等缺点。(2)基于监督学习的关系抽取。将大量人工标注的数据送入模型中训练,刘克彬等[24]根据本体知识库训练模型,在开放数据集中对关系进行抽取,取得了极高的准确率。Sun与Han[25]提出了名为FTK(Feature-enriched tree kernel)的模型,利用设计好的有效特征训练,计算关系实例相似度并通过支持向量机对关系进行分类。(3)基于半监督或无监督学习的关系抽取。基于少量人工标注数据或者无标注数据,使用最大期望(Expectation maximization)等算法的半监督关系抽取方法进行关系抽取。Sun与Grishman[26]提出名为LGCo-Testing的主动学习系统,Fu与Grishman[27]则进一步优化了这个系统。Ji等[28]提出基于句子级注意力和实体描述的神经网络关系抽取模型APCNNS。该模型实际采用了多示例学习的策略,将同一关系的样例句子组成样例包,关系分类是基于样例包的特征进行的。实验结果表明,该模型可以有效地提高远程监督关系抽取的准确率。在采用多示例学习策略时,有可能出现整个样例包都包含大量噪声的情况。针对这一问题,Feng等[29]提出了基于强化学习的关系分类模型CNN-RL(Convolutional neural networks and reinforcement learning),该模型包括2个重要模块:样例选择器和关系分类器。实验结果表明:该模型获得了比句子级卷积神经网络和样例包级关系分类模型更好的结果。最近的工作通过强化学习来处理句子级的去噪,这种学习将来自远程监督的标签视为事实。然而,很少有工作专注于直接校正噪声标签的标签级降噪。Sun等[30]提出了一种基于强化学习的标签去噪方法,用于远程监督关系提取。该模型由两个模块组成:抽取网络和策略网络。标签去噪的核心是在策略网络中设计一个策略来获取潜在标签,可以在其中选择使用远距离监督标签或从抽取网络预测标签的操作。实验结果表明,强化学习对于噪声标签的校正是有效的,并且所提出的方法可以胜过最新的关系抽取系统。

属性抽取的目标是补全实体信息,通过从样本源中获取实体属性信息或属性值。实体属性可以看作是属性值与实体间的一种关系,因而可以通过关系抽取的解决思路来获得。Wu与Weld[31]利用百科类网站的半结构化数据,训练抽取模型,之后将抽取模型应用在非结构化数据中抽取属性。Chang等[32]提出了基于张量分解的关系抽取方法,这一方法也可以应用在属性抽取中,通过利用关于实体种类相应的领域知识来更好地获得实体所缺少的属性值。




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:最新进展 关键技术 新进展 maximization Architecture

沙发
三重虫 发表于 2022-1-5 11:32:03

藤椅
saplow 发表于 2022-9-13 12:58:30
好贴就点赞,一起拿积分

板凳
三江鸿 发表于 2022-10-29 12:57:57 来自手机
点个赞加点人气
感谢分享

报纸
shijls 学生认证  发表于 2022-11-27 20:14:57
挺好的,有没有完整文章链接?

地板
eeabcde 发表于 2023-7-30 13:55:30
点赞支持

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-9 02:57