楼主: 时光永痕
1055 0

[数据挖掘新闻] 自然语言处理和自然语言生成的基础 [推广有奖]

  • 0关注
  • 14粉丝

svip3

学术权威

12%

(VIP/贵宾)三级

93%

威望
0
论坛币
26 个
通用积分
49.7576
学术水平
4 点
热心指数
4 点
信用等级
4 点
经验
34070 点
帖子
2731
精华
0
在线时间
317 小时
注册时间
2020-7-21
最后登录
2024-5-13

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
自然语言处理 (NLP) 是以自然语言的形式生成有意义的短语和句子的过程。自然语言处理排除了自然语言理解 (NLU) 和自然语言生成 (NLG)。NLU 接受数据输入并将其映射为自然语言。NLG 进行信息提取和检索、情感分析等。

在自然语言处理中,机器学习训练算法研究人类编写的数百万个文本示例——单词、句子和段落。通过研究样本,训练算法可以了解人类语音、写作和其他交流方式的“上下文”。该培训有助于 NLP 软件区分各种文本的含义。NLP 的五个阶段包括词汇(结构)分析、语法分析、语义分析、语篇整合和语用分析。NLP 的一些著名应用领域是光学字符识别 (OCR)、语音识别、机器翻译和聊天机器人。

加入我们的数据治理和信息质量会议
从 2022 年 6 月 6 日至 10 日在圣地亚哥举行的数十个真实案例研究、教程、研讨会等中学习。

现在注册
在处理顺序方面,NLG 在 NLP 之前。NLG,一个子集 人工智能, 将数据转换为自然发音的文本——就像人类说或写的方式一样。在日常生活中,您可能会在不知不觉中遇到许多 NLG 实例。当您向 Alexi 询问预报或向 Siri 询问路线时,NLG 就在幕后工作。NLG 帮助 Narrative Science 或 Automated Insights 等公司大规模提供数据讲故事。

一次 NLP 解锁 隐藏在数据中的上下文并将其转换为人类语言,NLP 获取输出并分析上下文中的文本。你可以想到 自然语言处理和自然语言处理 共同致力于  在许多不同的人工智能应用程序之上提供现成的对话界面。自然语言生成和处理在应用领域迅速普及,Alexa 只是他们在全球范围内取得成功的一个例子。

Mordor Intelligence 预测,到 2026 年,全球 NLP 市场预计将触及420.4亿美元,复合年增长率为21.5%。NLP 的 2022 年顶级用例将是客户服务聊天机器人、假新闻检测、社交媒体监控、多语言 NLP,以及在训练模型中使用监督、无监督和强化学习。

这2021 年 NLP 趋势包括两种不同类型的发展:

影响训练模型的趋势,例如监督和非监督学习的协作、强化学习的使用、深度学习 (DL) 的准确分类以及使用迁移学习来进一步调整模型。
用于市场情报监控、自定义推荐、社交渠道情绪分析、增强型聊天机器人和虚拟助手以及语义搜索的新 NLP 功能
有趣的是,越来越多的 NLP 和 NLG 正在通过类似人类的协助合作改变投资管理部门。例如,在交易前阶段,NLP 和 NLg 用于收集、分析和汇总来自多个来源的数据。此外,内置的人工智能技术可以使投资决策合理化,为忙碌的投资分析师节省时间。

围绕自然语言生成   的神话
自然语言生成是一种将数据分析、解释和组织成可理解的书面文本的技术。NLG 帮助机器对许多变量进行分类并将“文本放入上下文中”,从而提供符合英语语法规则的听起来自然的句子和段落。在这种情况下,您可能会发现KDNugget 帖子标题为自然语言生成概述——NLG 值一千张照片吗?很有启发性。

使用 NLG,数据科学家可以自由地直接进入数据分析,而不必担心复杂的数据准备方法。当今市场上知名的 NLG 供应商包括 Arria、Narrative Science 和最近被 Salesforce 收购的 BeyondCore。根据 AI、机器学习、NLP 和 NLG:您的商业人工智能基本指南, NLG 供应商越来越多地与 BI 解决方案提供商合作,以提供强大的解决方案。Yseop 的副总裁 Matt Rauscher 描述了最新 BI 平台的这种嵌入式 NLP 功能:

“Savvy 从 CRM 应用程序中获取数据,其规则引擎会根据数据自动决定销售人员应该向哪些客户销售哪些产品,然后 NLG 工具会写下他们需要做什么以及为什么要做。”

自然语言处理的市场成功案例   
最近,IDC、Forrester 和 Gartner 等著名市场观察者在多份市场报告中就自然语言处理的商业可行性提供了他们的见解和专家观点。从 1960 年到 2020 年的完整 NLP 格局包含了其中最重要的发现市场报告,并提供令人信服的论据来支持已经获得市场影响力的对话界面的技术功能。

本文的关键部分是对“聊天机器人”的深入分析,它们在复杂的智能手机存在的情况下为生存而战。此外,本文还回顾了常见的文本分析功能,例如实体识别、概念提取、文本分类、情感分析以及关系提取或解析。

文本分析是一个热门话题,主要的 IT 供应商已经开始提供自己的文本分析解决方案。例如,IBM 现在提供 SPSS Text Analytics,SAS 提供 Text Miner 软件,SAP 推出了 HANA Text Analytics,Oracle 在其 Data Miner 中捆绑了文本挖掘功能。这一趋势表明,独立的文本分析供应商可能很快就会发现很难与这么多提供捆绑解决方案的大型 IT 参与者一起推销他们的解决方案。

该报告暗示,“情绪分析”可能是当今文本分析技术的主要关注点,这促使供应商将其解决方案重新定义为社交 CRM 或 CEM 产品。

NLP 在医疗保健和生命科学领域取得了长足的进步,尽管市场增长在大流行期间受到了一些影响。虽然这一时期对全球市场参与者提出了新的威胁,但也发现了需要药物研究、药物开发等的新机遇和新细分市场。

自然语言处理是机器语言学的一种形式吗?
NLP 指南:人工智能和语言学的融合将自然语言处理与语言学领域进行比较,并建议 NLP 和深度学习可以通过规则赋予机器所说的语言一些意义。NLP 可以被视为机器语言和人类语音的自然语言之间的桥梁,使机器能够通过严格遵循内部通信协议将其语言解释和翻译成人类语言。

在最近的一次福瑞斯特报告,已经提到了两种形式的 NLG。“analytics:refer”的缩写 NLG 是指不能自定义的短脚本自动化 NLG。另一方面,基于模板和规则的长格式 NLG 可以适应完全定制和频繁更新。长格式 NLG 适用于生成冗长、复杂的内容。Salesforce 宣布了一项收购 Narrative Science 的协议,随后 Tableau 将通过额外的 NLG 功能得到加强。这对现有 Tableau 客户来说是个好消息,因为他们将可以访问“根据他们的用例而定的短格式和长格式 NLG”。此外,长格式 NLG 将在企业 BI 平台

根据 2022 年全球 NLG 软件市场研究报告,自 2019 年 Covid 在中国爆发以来,Covid-19 对这个市场产生了重大影响。在 2016 年至 2021 年期间,这个市场以数百万美元的速度增长,希望这种市场增长模式将持续到 2026 年. 复合年增长率 (CAGR)。

自然语言处理、自然语言生成及其连接方式
什么是自然语言生成 (NLG)? 解释如何NLP 和 NLG 使用机器学习、决策树、支持向量机、神经网络和深度学习等不同的技术将学习应用于可用数据。文章 自然语言处理的演变:2021-2022 年描述了 NLP 如何帮助发现隐藏在多结构化和多源数据(主要是文本数据)中的数据模式。如果没有这项强大的技术,所有这些宝藏都不会被开发出来。

自然语言处理 (NLP) 和自然语言生成 (NLG) 在 机器学习 (ML),因为迫切需要理解文本及其不同的结构、隐含意义、情感和意图。自然语言处理和自然语言生成通过将机器语言翻译成人类语言,并为人类完成以前不可能完成的任务创造机会,消除了人类与计算机之间的许多沟通障碍。

NLG 和 NLP 通常用于欺诈检测和安全应用程序,共同使自动化助手和工具能够从原始数据中发现含义。有一些技术障碍阻碍了 NLP 和 NLG 的全面采用,但一旦跨越这些障碍,预计 AI 应用程序将推动客户应用程序,尤其是那些处理繁重文本分析的应用程序。

      相关帖子DA内容精选
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:自然语言 语言处理 Intelligence Narrative Analytics

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-14 07:06