楼主: 时光永痕
475 0

[数据挖掘新闻] CEO需要了解的有关机器学习算法的知识 [推广有奖]

  • 0关注
  • 14粉丝

svip3

学术权威

12%

(VIP/贵宾)三级

39%

威望
0
论坛币
26 个
通用积分
49.7576
学术水平
4 点
热心指数
4 点
信用等级
4 点
经验
34070 点
帖子
2731
精华
0
在线时间
316 小时
注册时间
2020-7-21
最后登录
2024-4-24

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
CEO需要了解的有关机器学习算法的知识
在2011年我在麦肯锡的第一个项目中,我为一家银行的首席执行官服务,涉及他的小企业战略。我想对银行的数据进行线性回归,但是我的老板告诉我:“不要这样做。他们不了解统计数据”。(我们没有使用机器学习,但在接下来的7年中,我仍然相信我们制定了正确的策略)。
人工智能是我们这个时代最通用的技术。借助更好的视觉系统,语音识别技术或基于机器学习的推荐引擎,正在开发新产品和新流程。实际上,人工智能在机器学习领域已取得了最新进展。
在2004年麦肯锡之前,我开始了自己的职业生涯,当时是移动软件开发人员。那时,我必须为代码的每一步编写精确的指令。那时,开发当今电话的语音识别系统将是乏味且容易出错的。它实际上需要数十万条详细的指令来整理每个步骤,包括从声波中识别音素,将它们分组为语音词,在语音字典中查找它们,用预定义的块将含义进行编码,确定对语音的答案。通过巨大的预定义语义决策树提问...
早在2004年构建 Amazon Alexa 就是不可能的。而且这是不可能的:Alexa于2014年发布。机器学习是一项技术突破,开发人员可以使用它来编写软件,该软件可以学习如何解决问题,而无需提供逐步的说明。这是一场革命。
机器学习方法主要有三种类型:
有监督的学习:机器通过查看已解决的示例进行学习。这是您为高中数学考试做准备的方式。
无监督学习:机器通过识别模式的异同来学习。这是您了解树与猫或房屋不同的方式。
强化学习:机器通过尝试最大化奖励来学习。这是您通过反复试验学会玩超级马里奥的方法。
机器对非常具体的问题的狭understanding理解并不涉及更广泛的智能。至少还没有。这是关于人工智能的最大困惑。
监督学习:  如何通过审查已解决的问题为高中数学考试做准备
教学方法很多。不同的老师使用不同的方法。有些人喜欢讲理论,有些人则鼓励学生练习。我上高中时发现一种特别有用的方法是查看已经解决的数学问题,以学习如何解决类似的问题。
监督学习是精确地做到这一点的算法的集合。他们可以通过查看有关特定问题的正确答案的许多示例来学习如何解决问题。这个过程称为训练算法。该问题的解决方案可以是分类的,也可以是连续的:
通过查看历史客户及其贷款的特征,我们已经知道结果了,一台机器可以学会推断哪些未来客户将拖欠其贷款,哪些客户不会拖欠其贷款。这是一个明确的结果:默认还是没有默认?
机器可以根据历史数据集学习估计新公寓的价格,该历史数据集包含交易的价格和公寓的特征,例如大小,房间数或邮政编码。这是一个持续的结果:确切的价格是多少?
监督算法有很多种,但大多数是决策树,回归,支持向量机和神经网络的不同变体,其中包括深度学习。   
甲决策树是流程图状结构,其中在不同的属性测试随后进行直到最后的决定被满足。简单的决策树具有高度的可解释性,并且被管理人员广泛使用。但是,当机器对数百个分支中的数千个属性进行测试时,对于经理来说,事情可能变得太复杂了。这些更高级的基于树的算法的示例是随机森林,该算法通过平均多个决策树来提高简单决策树的准确性,或者梯度增强树也以顺序方式使用多个决策树,其中每个树都试图更正前一棵树的错误。     
回归 是非常流行的监督算法系列。由于它们的简单性以及在经济学领域的众多应用,它们是我在芝加哥布斯的MBA期间统计学课程的核心部分。
回归尝试使数据上具有特定形状的公式拟合。例如,如果您认为销售与独立因素(例如竞争价格,广告支出,促销甚至天气)之间存在线性关系,则可以使用已经知道销售情况的历史数据来训练线性回归算法。该算法将找到线性公式的确切参数,这些参数将用于预测未来的销售额。有线性,二次,指数,对数回归等。Logistic回归是一种非常有用的回归,它具有一个简单的指数公式,您可以使用它来预测二进制输出而不是连续输出:我的客户是否会根据我掌握的有关她的所有数据而流失?   
支持向量机 通常但并非总是用于分类问题,例如,识别图片上人物的性别或客户是否对价格敏感。想象一下,您可以以一种价格敏感的客户位于某个边界线之上而非敏感客户位于该边界线以下的方式在二维图中表示您的客户。支持向量机使用数百个尺寸和任意形状的边界来精确地做到这一点。
最后一种也是最有趣的一种监督学习算法是神经网络。当我学习工程学时,我的教授用它们来识别车牌或纸质选票中的字符。
神经网络试图复制我们大脑的工作方式。简单来说,神经元是分层组织的,每个神经元都从上一层中的其他神经元获取一些输入,并向下一层中的神经元提供一些输出。多层之后的最终聚合输出是算法的输出。当您使用大量示例训练神经网络时,指示如何计算每个神经元输出的公式将学习正确的值,这将导致正确的预测。请参阅下面的人脸识别示例。
简单的神经网络已经发展成为深度学习网络,与早期算法相比,它具有明显的优势。随着训练数据集中示例数量的增加,简单网络的性能会提高,但仅达到一定程度后,其他数据才能带来更好的预测。深度学习似乎没有此限制。  
深度学习网络主要有两种:一种可以记住上下文,另一种则不能:
在那些无法记住上下文的神经网络中,每个预测都独立于先前的预测。它们被称为卷积神经网络,通常用于图像处理,例如,基于医学图像来诊断疾病,例如癌症,在社交媒体上查找徽标,或从产品图像中检测有缺陷的产品线。
但是有些问题需要神经网络记住上下文,因为每个预测的值将取决于先前的输入或先前的输出。这些神经网络称为循环神经网络,通常用于涉及时间序列的应用程序,例如语言翻译,可以解决客户查询的聊天机器人,或识别构成欺诈行为的一系列交易。  
除了这种算法外,机器学习中经常使用许多数学学科,它们都是在无人监督的情况下监督的,例如,时间序列分析 和图论:
时间序列分析使我们能够了解事件的序列并预测未来的值或检测异常。每日销售额,股票市场和人类语言是时间序列。
图论使我们能够分析和建模对象之间的成对关系,例如我们如何与Facebook朋友互动。
无监督学习:  您如何分辨房屋或猫咪以外的树木
人类是优秀的无监督学习者。我们可以通过只看猫,树或房屋中的许多动物并推断它们是不同的东西,来分辨它们之间的区别。但是,很难以这种方式构建机器。暂时而言,无监督机器学习的发展远不及有监督机器学习。当无监督学习变得有效和广泛时,它将涉及人工智能的飞跃。
当无监督学习变得有效和广泛时,它将涉及人工智能的飞跃
当您不知道如何对数据进行分类或聚类并且需要算法来查找模式并对数据进行分类时,通常使用无监督学习。这些算法用于例如根据这些细分来细分客户或向客户推荐产品。
有两种主要的无监督聚类算法:那些需要您 先验地  了解您需要多少个集群的算法和那些不需要。例如,如果您知道要一百个客户群,则  K-means聚类 或高斯混合模型之类的算法  会将您的客户分为一百个聚类,以使聚类彼此之间以及每个聚类中的元素尽可能不同集群彼此之间尽可能相似。否则,如果您不知道聚类的数量,则诸如  层次聚类之类的算法  将使用决策树来形成分类。
除聚类之外,无监督学习还可用于特征提取或异常检测。
强化学习: 如何通过反复试验学会玩超级马里奥游戏
我80年代和90年代的一些朋友仅仅花了几个小时就可以在几天之内进入视频游戏的最终画面,例如Mario或Sonic the Hedgehog,这是强化学习:反复试验。
有时您没有很多数据,唯一了解环境的方法是与环境进行交互。这是第三种机器学习算法派上用场的时候。强化学习算法通过简单地执行任务并尝试使奖励最大化来学习执行任务。您将需要为无监督学习机指定游戏规则:当前状态和目标,允许动作的列表以及这些动作的约束以及奖励系统。
例如,IBM的Deep Blue使用强化学习来学习国际象棋,并最终在1997年击败了国际象棋冠军加里·卡斯帕罗夫。强化学习的其他应用包括战争游戏(例如优化交易策略),优化自动驾驶的驾驶行为。汽车,实时优化定价等。神经网络也可以用作增强算法。
我遇到的最复杂的业务问题需要加强学习:例如,管理海运行业的例外情况。
“卡普尔船长正驾驶着一艘1
我能按计划加快打电话给上海吗?但是我航行得越快,我消耗的燃油就越多。我先打电话给我的下一个港口香港,然后再打电话给上海。但是很快就是中国的黄金周。我要取消上海吗?延误的罚款是多少?还是公司可以安排从我的下一个港口到上海的一艘较小的船?上海要交多少个集装箱?他们都吃饱了吗?我要放慢脚步并保持航行路线吗?
幸运的是,卡普尔船长的船上装有强化学习系统,称为Dooriya(虚构名称),该系统可以模拟数百种选择,并推荐安全选择,从而使公司的最低额外成本降至最低。Dooriya得出结论,最好的选择是跳过上海,而是打电话给深圳,然后再打电话给香港。新加坡的区域总部与Dooriya达成共识。这次,去上海的集装箱不多,可以与另一家公司共享替代运输。卡普尔船长命令机组人员将风暴南下的航向改为深圳。尽管他永远不会承认,但船长松了一口气。”
结论
机器可以完成非常特殊的任务,例如从医学图像中识别癌症,因此可能会比人类出色,有时甚至比人类好几个数量级。但是,计算机比医生能够更准确地检测出癌症,这一事实并不意味着计算机甚至可以理解什么是癌症,可以了解其发展或如何阻止癌症或对人类意味着什么。机器对非常具体的问题的狭understanding理解并不涉及更广泛的智能。至少还没有。这是关于人工智能的最大困惑。
1
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:机器学习算法 学习算法 机器学习 CEO Understand

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-25 15:23