楼主: 时光永痕
1773 0

[数据挖掘新闻] 数据分析师需要知道的基本机器学习算法 [推广有奖]

  • 0关注
  • 14粉丝

svip3

学术权威

12%

(VIP/贵宾)六级

32%

威望
0
论坛币
26 个
通用积分
57.2086
学术水平
4 点
热心指数
4 点
信用等级
4 点
经验
34190 点
帖子
2733
精华
0
在线时间
321 小时
注册时间
2020-7-21
最后登录
2024-8-1

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
人工智能正在接管。在 2021 年,我们将看到机器学习在数据分析中发挥更大的作用,因为算法能够减少错误并在自身内部生成更准确的模型。这些算法涵盖迭代过程、决策树以及数据集的多维拆分。机器学习使数据分析师能够获得新的、更深刻的见解,影响从营销部门到我们学习方式的方方面面。以下是 2021 年的基本机器学习算法。

1) 线性回归

“线性回归算法是一种高度准确的预测模型,多年来一直用于统计分析,” Write My X 和Britstudent的人工智能专家 Bruce Endres 说。“机器学习正在适应线性回归,并通过采用一系列因变量和自变量来准确预测这些变量之间的关系。”

无论您的分析对象是什么,线性回归算法都可以根据一系列输入提供有关它们的有价值信息。熟练的工程师可以建立线性回归模型,以消除密切相关的变量,这些变量会使结果产生偏差,并消除不相关的变量——数据中的噪声。由于机器学习算法采用线性回归,它本身会识别噪声和相关变量,因此随着时间的推移它会变得更加准确。

2) 决策树

决策树是一种流行的 ML 算法,用于对问题进行分类和分类,以便更有效地处理它们。决策树根据选定的变量将集合划分为任意数量的类别,并且可以导致集合中可能性之间的复杂区分。

ML 决策树划分设置,通过根据功能对变量进行分类来深入分析。从视觉上看,这会创建一棵“树”——许多分支源于一条路线——这是一个可以引导决策制定的信息化过程。

3)支持向量机(SVM)

支持向量机用于对数据进行分类,并且在存在大量变量时可以深入揭示。原始数据点绘制在多维空间中的图上,其中维数“n”与数据的特征数一致。然后,这些原始数据点很容易根据它们在多维图中的位置进行分类。

然后可以通过这些图表绘制线条以将数据点汇集到子集中。以这种方式分类的数据对于希望理解和推断的分析师来说更容易接近。

4)K-means聚类

K-means 聚类是一种获取不同数据集并为其中保存的数据找到分类的方法。通过K-means,数据集被分类成包含同质数据点的集群。

ML 算法通过将数据拆分为每个集群的一定数量的点来使用 k-means 聚类。然后重新分析数据,形成具有更接近值的新集群。这个过程反复发生,并产生对有意义的分组的准确见解。

5) 先验

Apriori 算法最常见于市场分析中,用于揭示数据库中经常出现的产品组合。该算法采用两个数据点,我们称它们为 A 和 B,然后识别这两个产品之间的正相关和负相关。

“先验算法的一个应用是使销售部门能够识别通常吸引消费者的产品之间的联系,” 1day2write 和Custom Coursework 的技术作家 Teresa Govan 说。“通过识别这些相关性,销售团队可以更好地定位他们的营销材料。”

6)随机森林

这种集成学习技术——意味着多个算法相互叠加——从数据集中获取多个决策树,并将变量子集随机分配给决策树的每个阶段。随着决策树的生成,然后根据它们的价值重复或丢弃,这种随机化过程会蛮力产生新的见解。

随机森林算法通过生成多棵树并丢弃被认为最错误的树来降低单个决策树中的错误风险。尽管随机树算法所需的计算能力更大,但结果是一个更可靠的模型。

      相关帖子DA内容精选
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:机器学习算法 数据分析师 学习算法 数据分析 机器学习

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-11-6 09:41