楼主: 时光永痕
601 0

[数据挖掘新闻] 如何在下一个机器学习项目中节省超过20万美元 [推广有奖]

  • 0关注
  • 14粉丝

svip3

学术权威

12%

(VIP/贵宾)三级

44%

威望
0
论坛币
26 个
通用积分
49.7576
学术水平
4 点
热心指数
4 点
信用等级
4 点
经验
34070 点
帖子
2731
精华
0
在线时间
316 小时
注册时间
2020-7-21
最后登录
2024-4-24

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
如何在下一个机器学习项目中节省超过20万美元
机器学习应用程序需要功能强大且可扩展的计算系统,这些系统可以承受这些应用程序的高计算复杂性。从事机器学习领域的公司必须为机器学习应用程序的OpEx分配大量预算,无论这是在云上还是在本地进行。
典型的机器学习应用程序(尤其是在使用自动ML时)可以扩展到多达30个节点或更高(服务器)以提供有用的结果,从而显着提高TCO。例如,Auto ML通过尝试找到最佳配置来自动执行许多数据分析和建模过程。为了实现这一目标,它必须使用机器学习应用程序执行多个测试用例,这些应用程序会消耗大量的时间和成本方面的资源。
但是,云提供商(例如AWS,阿里巴巴和Nimbix)已开始部署新平台,这些平台可用于加快和减少这些应用程序的运营支出。与CPU和GPU相比,可编程硬件加速器(如FPGA)可以提供更高的吞吐量,同时有助于减少计算密集型应用程序的OpEx。  
在这个用例中,我们展示了一个示例,该示例说明了公司如何利用云中或本地的硬件加速器节省超过20万美元。
用例:在30个节点上进行逻辑回归培训
逻辑学习是机器学习领域中使用最广泛的应用之一。Logistic回归用于为许多复杂的模式匹配和分类问题构建预测模型。它被广泛应用于生物信息学,金融和数据分析等各个领域。在这种情况下,我们评估了在30个节点上训练大型数据集的总运营支出。我们评估大型MNIST数据集的性能和成本(但是可以应用任何其他数据集)。  
如果一家公司将30个节点的集群用于机器学习培训,那么每年的总成本约为302
R5d.4x费用:1.15 * 24 * 365 * 30 = 302
但是,如果同一家公司在AWS上使用新的f1实例,则可以显着加快模型的训练速度,同时可以显着降低OpEX。该加速ML套件从InAccel是度身订造为F1实例在AWS上可以实现高达15倍的增速相比,r5d.4x logistic回归的培训。这意味着该公司可以选择使用相同数量的节点将其应用程序运行速度提高15倍,也可以将节点数量减少到仅2个节点。下图显示了使用aws上的硬件加速器(f1)节省的总运营支出。   
f1.4x成本:3.3 * 24 * 365 * 2 = 57
ML加速器的成本为每小时1.15美元。因此,加速器许可证的总成本为2个节点每年2万美元。
要使用硬件加速器,过去必须更改应用程序,以确保处理器能够卸载硬件加速器中计算量最大的算法。但是,使用InAccel的库,用户不必更改一行代码。仅基于InAccel,例如基于Apache Spark的ML应用程序就可以无缝运行,而根本无需更改其代码。即使考虑到FPGA资源管理器的许可费用(每年每节点1k),该公司总共也可以节省20万美元。
AWS和Nimbix上均提供了有关如何使用加速器立即测试和部署机器学习应用程序的示例。   
但是,最重要的优势是,公司最有价值的资源(ML工程师和数据工程师)将能够更快地执行任务并获得更快的结果,这意味着在人员成本方面可以进一步节省。

关注 CDA人工智能学院 ,回复“录播”获取更多人工智能精选直播视频!


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:机器学习 Apache Spark logistic回归 logistic ogistic

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-27 05:20