人大经济论坛 › 论坛 › 数据科学与人工智能 › 数据分析与数据科学 › 数据分析与数据挖掘 › 使用Orange（.ows）可视化编程软件预测员工流失

CDA数据分析研究院

商业数据分析与大数据领航教育品牌



经管云课堂

经管/金融/财会/社科/名师公开课



学术培训

Stata 空间计量 SSCI Python

贵宾：通行论坛特权+数据库权限
+案例库+下载特权 VIP：论坛特权+更多下载次数
+ccerdata数据库+更高阅读权限+……

发帖

楼主: 时光永痕

906 0

[数据挖掘新闻] 使用Orange（.ows）可视化编程软件预测员工流失 [推广有奖]

0关注
14粉丝

svip3

学术权威

12%

（VIP/贵宾）四级

24%

威望: 0 级
论坛币: 26 个
通用积分: 49.8622
学术水平: 4 点
热心指数: 4 点
信用等级: 4 点
经验: 34070 点
帖子: 2731
精华: 0
在线时间: 317 小时
注册时间: 2020-7-21
最后登录: 2024-5-13

楼主

时光永痕

发表于 2020-12-7 20:17:31 |只看作者 |坛友微信交流群|倒序 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

使用Orange（.ows）可视化编程软件预测员工流失
如果您想知道–如何使用机器学习算法进行预测，那么–继续阅读并继续学习。
尽管没有确定损失受薪雇员费用的任何行业标准，但一些研究（例如SHMR）预见到，企业每次更换受薪雇员时，都要花费大约5到8个月的补偿。对于一个年薪为50
但是，其他人则预见到这笔费用要多得多–比失去一个受薪工人可能要付出其年度报酬的2倍之多，尤其是对于中高层管理人员而言。巨大的成本包括招募，入职和长期丧失效率的费用。
通过阅读本文，可以了解两种不同的观点：–
个人观点–组织如何使用机器学习算法计算人员流失率，还可以估计是否有机会在组织中应用的机会。
公司观点：组织还可以了解是否应该开始招聘。如果员工流失率很高，那么组织还需要了解修改当前员工保留政策的时间。
分析可能影响IBM员工流失率的因素和必要条件，最后进行分类-平均而言，尚未填补多少百分比的员工职位。
什么是橘子？
Orange是用于该领域的可视化编程软件包。它的使用范围广泛，从机器学习，数据挖掘和数据分析等开始。橙色工具（称为小部件）在简单的数据可视化和对学习算法和预测性建模的经验性评估的预处理范围之内。可视化编程是通过组合实现的，其中通过链接用户设计的小部件来设计工作流。
同时，熟练的用户可以将Orange用作Python库来处理数据和更改小部件。橙色视觉编程
损失率
员工流失率用于量化在一段时间内丢失但尚未更换的员工。该比率似乎是与总劳动力相比的百分比。人力资源部门经常使用减员率来确定空缺职位的数量。
首先，上载.CSV文件（包含IBM员工数据），然后选择所有目标列，即Attrition，然后从“数据列”中选择RANK小部件，因为排名有助于明确说明什么数据中最需要的。然后根据不同的等级选择了前20个数据头。
以橙色上传.csv文件
排序数据
根据观察数据RANK然后SELECTING所述从所述文件数据。
已使用数据表检查数据-根据数据表了解数据是否有缺失值-数据无缺失值。
橙色数据信息
它表明数据没有缺失值。
预测是通过橙色使用不同的模型进行的，然后使用“测试和评分”进行评估。
测试和评分随机森林橙
测试和评分SVM
测试和评分NN
使用三个不同的模型来获得最佳结果（第一个图像是随机森林模型）（第二个图像是支持向量机（SVM）模型）（第三个图像是人工神经网络（ANN）模型）。
在上一篇文章中，提到了随机森林是最佳模型。因此，这次使用了三种不同的模型-?随机森林，支持向量机（SVM）和人工神经网络（ANN），然后进行了比较以了解哪种模型将更有效，更好地进行更好的预测。
–在预测中使用了随机森林模型，因为：
随机森林是一种基于树的学习算法，由于它具有许多决策树，因此能够形成准确的决策。顾名思义，它是一片森林。因此，随机森林比单个决策树需要更多的训练时间。决策树中的每个分支和叶子都对随机特征起作用，以预测输出。然后，该算法将各个决策树的所有预测结合起来以生成最终预测，并且它还可以处理缺失值。
–在预测中使用了支持向量机（SVM）模型，因为：
SVM具有正则化功能。因此，它具有良好的泛化能力，可以防止其过度拟合，还可以用于解决分类和数值问题。数据的微小变化不会显着影响SVM。因此，SVM模型是稳定的。
–在预测中使用了人工神经网络（ANN）模型，因为：
人工神经网络就像我们的大脑。成千上万的细胞-称为神经元，以电信号的形式处理信息。类似地，在ANN中，网络结构具有输入层，隐藏层和输出层。由于它具有多层，因此也称为多层感知器。隐藏层称为“提取层”，它从数据/信息中提取一些关键模式并将其传递到下一层。然后，通过将数据与数据源区分开来，从而省去了多余的数据，从而使网络更快，生产率更高。
它捕获输入之间的非线性关系。
它有助于将信息/数据转换为更有用的见解。
在测试和评分（它有助于将定性数据（字符）分析并转换为定量数据（数字））之后，使用混淆度量标准来查看所有“真阳性”，“假阴性”值，分类错误的数据和正确数据。最后，使用分布可视化来了解数据。
结论
最终预测橙
最终预测结果是不同的-因此，现在需要取平均值（总人口的平均值）（是类别的平均值）（否类别的平均值）。
最终结果被证明是不同的，因为所有三个模型都有一些不同的值。因此，需要对所有结果取平均值。
题库

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏0 回帖

关键词：Orange Orang range 员工流失编程软件

[数据挖掘新闻] 使用Orange（.ows）可视化编程软件预测员工流失 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我拉你入群

相关帖子

本版微信群

[数据挖掘新闻] 使用Orange（.ows）可视化编程软件预测员工流失 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我 拉你入群

相关帖子

本版微信群

扫码加我拉你入群