楼主: 时光永痕
571 0

[数据挖掘新闻] 合成数据如何为现实世界的 AI 应用程序提供动力 [推广有奖]

  • 0关注
  • 14粉丝

svip3

学术权威

12%

(VIP/贵宾)三级

95%

威望
0
论坛币
26 个
通用积分
49.8595
学术水平
4 点
热心指数
4 点
信用等级
4 点
经验
34070 点
帖子
2731
精华
0
在线时间
317 小时
注册时间
2020-7-21
最后登录
2024-5-13

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
如今,机器学习 (ML) 算法无处不在。人工智能应用程序不是将来会出现的东西。他们已经在这里并且已经开始了产生影响在我们的生活中。人工智能的使用目前处于萌芽阶段,面临重大挑战。

最大的挑战围绕着数据的可用性。数据是任何 AI 训练系统的命脉,真实世界的数据很难获得。虽然隐私法限制了它的使用,但更大的问题是消费者行为正在迅速变化,而历史数据在为 AI 建模进行清理和准备时可能会变得过时。

合成数据对于帮助 AI 克服这一障碍至关重要。以下是这六个行业的公司如何开始使用合成数据为其产品提供动力。

自动驾驶汽车
自动驾驶汽车一直是汽车制造业长期追求的目标。即使是谷歌和苹果等科技巨头也一直在追求它,并取得了不同程度的成功。自动驾驶汽车开发是现实世界数据限制如何阻碍开发的完美示例。

机器学习算法动力自动驾驶汽车应该理想地在公共道路上行驶并通过真实世界的数据进行学习。然而,实施这样的计划既危险又不切实际。根据用户规范生成的合成数据集允许 AI 开发人员向他们的系统提供尽可能多的场景。

车辆算法会根据地形和情况无休止地进行训练,不会危及任何人的生命。结果,自动驾驶汽车的发展有了飞跃,他们已经已经击中公共道路。

营销
营销领域有无限数量的机器学习算法用例。从优化预算支出到创建定制活动再到探索买家行为模式,一切都已经成熟。问题在于 GDPR 和数据隐私法阻止公司将消费者数据提供给他们的算法。

复制真实世界数据的合成数据对于营销人员来说是天赐良机。这些数据集是通过复制较小的真实世界数据集并添加用户定义的参数来生成适用于各种条件的数据而创建的。消费者识别数据被虚假信息取代,从而保护了用户隐私。

H&M 等公司已经在使用机器人收集用户偏好并定制广告活动。从用户数据复制的合成数据将使这些营销活动更加有效。

监视
“遥感数据(由卫星、飞机和无人机捕获的图像)提供了一个独特的渠道,可以为广泛的行业发现大规模的宝贵见解,”说多尔赫尔曼,合成数据提供商 OneView 的首席执行官兼联合创始人。

国防工业是人工智能的早期采用者。人工智能在战场上的首批应用之一是监视。提醒士兵注意潜在威胁并让他们快速适应挑战至关重要。由于环境的性质,从战区收集的真实世界数据是混乱且不可靠的。

合成数据使国防部可以通过点击几个按钮来模拟各种各样的场景。与从战场收集的数据相比,算法的训练速度更快,成本也更低。最好的,合成数据允许团队在测试期间轻松随机化环境并更好地挑战他们的 ML 算法。

这人工智能的使用国防领域正在发展到包括远程无人驾驶车辆和战场医疗保健解决方案。合成数据是释放人工智能真正潜力和最大限度减少人类生命损失的关键。

金融
金融行业规模庞大,ML 应用无处不在。打击洗钱是全球金融公司的首要任务,使用人工智能检测交易中的异常模式很普遍。由于涉及不同的变量,检测反洗钱 (AML) 违规行为具有挑战性。

例如,恶意行为者可以使用任意数量的空壳公司、编号银行账户和备受推崇的司法管辖区的幌子公司的组合来隐藏洗钱的资金。为了识别 AML 违规行为,AI 算法需要在输入的数据中内置各种排列。

综合数据是金融公司唯一的解决方案,因为这些数据集可以快速生成,并且可以在其中构建多个场景。结果是一种学习速度更快并且可以更快地投入使用的算法。这些欺诈检测算法在保险行业也有应用,帮助公司发现索赔欺诈。

卫生保健
医学诊断包含大量无法用于训练算法的患者识别信息。然而,医疗保健提供者必须开发能够帮助检测疾病的早期发作并防止形成疾病集群的技术。例如,人工智能聊天机器人可以帮助患者进行自我诊断,减轻医院诊所的负担。

机器人,例如 Babylon Health 创建的机器人目前帮助患者但由于责任限制,不提供诊断。然而,合成数据可以帮助推动这些机器人的发展,使其能够充分发挥其潜力。

机器人技术
机器人应用已经取得了长足的进步,如今公司正在使用合成数据来训练他们的机器人准确地对现实世界的情况做出反应。可以定制合成数据集以准确地适应用例,并且不包含真实世界数据所具有的随机性。

虽然真实世界的数据是有效性的最终测试,但它对于培训目的并不实用。设计允许算法逐步学习其环境的结果的数据集是一种更好的方法。就像孩子们在期望他们阅读整本书之前学习他们的 ABC 一样,ML 算法需要一种量身定制的学习方法。

合成但准确
合成数据不能完全复制现实世界的数据,但这并不意味着它受到任何限制。通过仔细的参数定义和场景规划,机器学习算法可以使用合成数据更快、更有效地学习场景。随着消费者开始期待更好的体验人工智能应用,合成数据是进步的关键。

      相关帖子DA内容精选
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:应用程序 Babylon 机器学习算法 Health 无人驾驶车

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-15 03:57