楼主: 时光永痕
436 0

[数据挖掘新闻] 以数据为中心的人工智能:它是真的吗?给大家?我们准备好了吗? [推广有奖]

  • 0关注
  • 14粉丝

svip3

学术权威

12%

(VIP/贵宾)三级

24%

威望
0
论坛币
26 个
通用积分
49.7565
学术水平
4 点
热心指数
4 点
信用等级
4 点
经验
34070 点
帖子
2731
精华
0
在线时间
316 小时
注册时间
2020-7-21
最后登录
2024-4-19

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
现代深度学习算法的兴起已经迫使世界融化在它的怀抱中。
协同数据科学和人工智能实际上正在行业巨头中付诸实践。
以数据为中心的人工智能正在成为下一件大事,我们应该为此做好准备!
今年早些时候,不断壮大的 AI 社区开始思考从以模型为中心的方法转向以数据为中心的 AI 开发的可能性。为了跟上以数据为中心的 AI 项目方法的发展势头,我们从全球的行业领导者和智囊团中提取了富有洞察力的信息。



以数据为中心的人工智能概念

在过去的几十年里,人工智能开发的主要范式是模型或以软件为中心的方法。为了构建机器学习系统,您需要编写代码以将它们实施到您的算法和模型中,并获取代码并训练数据以提取有意义的见解。在过去的几十年里,我们大多数人下载数据集,将数据集保持为固定,然后修改软件代码以理解数据。

尽管如此,过去几年观察到神经网络和其他算法的巨大进步(感谢这种机器学习研究范式)。正因为如此,许多应用程序上的开源代码正在成为一些人的支持合作者,而对另一些人则不支持。例如,GitHub是开源软件的一个很好的例子,证明对一些人很方便,但对另一些人则不然。你可能想知道为什么会这样?那么,系统的应用就在这里发挥作用了!



以数据为中心的方法适合所有人吗?

即使我们甚至可以修复代码,考虑以数据为中心的方法对您和我们所有人来说也不会更有成效。相反,我们应该将注意力集中在生成或创建正确的数据以提供给学习算法。Landing AI 由著名的计算机科学家和技术企业家 Andrew Ng 创立,几年来一直致力于开发以数据为中心的计算机视觉 MLOps 平台。Ng 坚信以数据为中心的概念和深度学习爱好者。Ng 支持的概念在技术社区中获得了极大的吸引力。数据科学和人工智能相结合的概念实际上正在行业巨头中付诸实践。



以数据为中心的人工智能是真的吗?

以数据为中心的 AI 的预测分析已成为未来之物!社区的支持是巨大的,早期采用者正在增加。更重要的是,该概念的支持者已开始鼓励其他人加入并在实践中采用该概念。

每当人工智能采用或提出新的技术方法时;通常,是少数专家直观地进行实践。

例如,以深度学习的兴起为例。长期以来,有少数人以非常原始和手动的方式用 C++ 编写神经网络。最终,神经网络的想法变得更加普遍,许多人开始用 C++ 编写神经网络。在 2015/2016 年之间的某个时候,引入了 TensorFlow 和 PyTorch 等深度学习框架,使这些想法的应用更加系统化,并且更不容易出错。就以数据为中心的人工智能而言,多年来一直有很多人凭直觉在做这件事。

对该概念的广泛接受和支持预计将上升并主导机器学习生态系统。技术极客现在能够直观地设计语音和 NLP 数据。以数据为中心的人工智能正在成为下一件大事,我们应该为此做好准备!

一些被认为是追逐野鹅的东西现在正在变成真实的东西!



世界准备好采用以数据为中心的方法了吗?

现代深度学习算法的兴起迫使世界融入这种方法。对于专家来说,理解算法的复杂方法使他们更容易专注于数据。
现在,代码更加成熟,有望迅速发展。

随着概念的快速发展迫在眉睫,概念的实际实施对于企业生存变得至关重要。当我们使用成熟的工具来享受实践经验的时候已经接近了,这使得这些想法的应用更加可重复、流畅和系统化。

以数据为中心的人工智能:它是真的吗? 给大家? 我们准备好了吗?


如何为以数据为中心的方法做好准备

从今天开始为以数据为中心的方法做准备是明智的!Ng 分享了以数据为中心的 AI 开发的 5 大技巧,以帮助技术社区应对技术进步的冲击:

标签一致性
嘈杂的标签影响
发现不一致
明确标签说明
结构化错误分析
有时,处理数据或简单地进行数据清理的想法被认为是预处理步骤。你可能听人说过这样的话!但是,使用以数据为中心的 AI 方法,改进数据并不是您一次性执行的预处理步骤。它是算法训练和学习的真正重复工作。

数据改进是模型开发迭代过程的核心部分。专家认为,在多开发和部署后监控和维护模型是最佳实践。持续系统地改进数据也是部署、监控和维护的核心部分。

但是,使用以数据为中心的 AI 方法,改进数据并不是您一次性执行的预处理步骤。它是算法训练和学习的真正重复工作。数据改进是模型开发迭代过程的核心部分。

训练只是机器学习模型生命周期的一小部分。获取和准备质量数据涵盖了 80% 的 ML 流程;而训练部分则占剩余的 20%。但这并不意味着训练部分没有后者那么微不足道。

在学术研究和工业应用中,机器学习的训练方面具有重要意义。调查和研究表明,标签和数据注释对于准确和创新的 AI 以及获取补充或外部数据,甚至生成新数据—— 合成数据非常重要。



我们将走向何方?

机器学习领域的知名人士正在将我们的注意力转向系统数据工作的重要性。未来几年,世界将见证机器学习生态系统的范式转变。我们确信一件事;2010 年代都是关于模型改进的;2020 年代将全部与数据有关。



我如何开始?

以数据为中心的人工智能正在引领人工智能的未来发展,使有限的数据集可以实现将人工智能从概念到生产集成的运营和商业价值。我们相信这是真的;我们相信,是时候通过与以数据为中心的 AI 社区、资源、行业领袖、智囊团和思想领袖合作,开始学习和采用这一概念了。

      相关帖子DA内容精选
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:人工智能 CDA LEVEL landing excel函数 Tensor

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-20 06:25