楼主: 大多数88
731 15

[经济学] 使用Bagging算法提高预测精度,以评估 [推广有奖]

  • 0关注
  • 3粉丝

会员

学术权威

68%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
62.7298
学术水平
0 点
热心指数
4 点
信用等级
0 点
经验
23514 点
帖子
3880
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Use Bagging Algorithm to Improve Prediction Accuracy for Evaluation of
  Worker Performances at a Production Company》
---
作者:
Hamza Saad
---
最新提交年份:
2020
---
分类信息:

一级分类:Economics        经济学
二级分类:General Economics        一般经济学
分类描述:General methodological, applied, and empirical contributions to economics.
对经济学的一般方法、应用和经验贡献。
--
一级分类:Quantitative Finance        数量金融学
二级分类:Economics        经济学
分类描述:q-fin.EC is an alias for econ.GN. Economics, including micro and macro economics, international economics, theory of the firm, labor economics, and other economic topics outside finance
q-fin.ec是econ.gn的别名。经济学,包括微观和宏观经济学、国际经济学、企业理论、劳动经济学和其他金融以外的经济专题
--

---
英文摘要:
  Many workers at the production department of Libyan Textile Company work with different performances. Plan of company management is paying the money according to the specific performance and quality requirements for each worker. Thus, it is important to predict the accurate evaluation of workers to extract the knowledge for management, how much money it will pay as salary and incentive. For example, if the evaluation is average, then management of the company will pay part of the salary. If the evaluation is good, then it will pay full salary, moreover, if the evaluation is excellent, then it will pay salary plus incentive percentage. Twelve variables with 121 instances for each variable collected to predict the evaluation of the process for each worker. Before starting classification, feature selection used to predict the influential variables which impact the evaluation process. Then, four algorithms of decision trees used to predict the output and extract the influential relationship between inputs and output. To make sure get the highest accuracy, ensemble algorithm (Bagging) used to deploy four algorithms of decision trees and predict the highest prediction result 99.16%. Standard errors for four algorithms were very small; this means that there is a strong relationship between inputs (7 variables) and output (Evaluation). The curve of (Receiver operating characteristics) for algorithms gave a high-level specificity and sensitivity, and Gain charts were very close to together. According to the results, management of the company should take a logic decision about the evaluation of production process and extract the important variables that impact the evaluation.
---
PDF下载:
--> Use_Bagging_Algorithm_to_Improve_Prediction_Accuracy_for_Evaluation_of_Worker_Pe.pdf (583.5 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:bagging ING bag relationship Quantitative

沙发
能者818 在职认证  发表于 2022-4-24 15:23:34 |只看作者 |坛友微信交流群
研究文章开放存取工业工程与管理工业管理SN:2169-0316Saad,工业工程管理2018,7:2DOI:10.4172/2169-0316.1000257第7卷o第2期o1000257工业工程管理,开放获取期刊SN:2169-0316使用Bagging算法提高生产公司员工绩效评估的预测准确性美国宾厄姆顿大学哈姆扎R Saad*工业工程和系统科学系摘要利比亚纺织公司生产部门的许多员工以不同的绩效工作。公司管理层的计划是按照规定付款c.对每位员工的绩效和质量要求。因此,重要的是预测对工人的准确评估,以提取管理知识,它将支付多少钱作为工资和激励。例如,如果评估是平均的,那么公司管理层将支付部分工资。如果评估结果良好,那么它将支付全额工资,此外,如果评估结果良好,那么它将支付工资加激励百分比。12个变量,每个变量有121个实例,用于预测每个工人的流程评估。在开始classi之前阳离子,用于预测影响评估过程的重要变量。然后,采用四种决策树算法对输出进行预测,并提取结果输入和输出之间的关系。为了确保获得最高的精度,集成算法(Bagging)用于部署四种决策树算法,并预测最高的预测结果99。16%. 四种算法的标准误差非常小;这意味着投入(7个变量)和产出(评估)之间有很强的关系。

使用道具

藤椅
大多数88 在职认证  发表于 2022-4-24 15:23:40 |只看作者 |坛友微信交流群
算法的(接收器工作特性)曲线给出了一个高水平的规范城市和敏感度,以及收益图表非常接近。根据评估结果,公司管理层应对生产过程的评估做出逻辑决策,并提取影响评估的重要变量*通讯作者:Hamza R Saad,美国宾厄姆顿大学工业工程与系统科学系,电话:6077772171;电子邮件:hsaad1@binghamton.eduReceived2018年3月23日;2018年4月23日接受;发表于2018年4月27日引用:Saad HR(2018)使用Bagging算法提高预测准确性,以评估生产公司的员工绩效。工业部7:257。doi:10.4172/2169-0316.1000257版权所有:(c)2018 Saad HR。这是一篇根据知识共享署名许可证条款发布的开放获取文章,允许在任何媒体中不受限制地使用、分发和复制,前提是原始作者和来源均已获得授权。关键词:决策树;Bagging算法;生产绩效;ClassiCATIONIntroduction数据挖掘在预测生产路线图方面起着至关重要的作用。许多公司将数据挖掘作为解决复杂问题的工具,并从大量模糊数据中提取知识。传统技术难以理解电子制造过程,因此统计分析和质量工具无法处理所有日常数据。在美国,数据挖掘是一种合适的技术,用于提取基本知识,建立变量之间的关系,并做出正确的决策,以改进评估过程[1]。是与生产过程相关的案例研究,用于根据实际输入变量预测每位辛勤工作人员的绩效。很少有研究关注工人评估,尤其是在生产和制造业。

使用道具

板凳
kedemingshi 在职认证  发表于 2022-4-24 15:23:47 |只看作者 |坛友微信交流群
搜索者使用数据挖掘方法从机构数据库中提取基本模式[2]。Di使用关联规则和K-均值等erentdata算法来预测评估性能。当前的绩效评估需要支持绩效工资调整和职等内或职等变动加薪的建议[3]。此外,这有助于监管机构而那些表现出色的员工需要特别注意,通过采取特定的行动来优化下降率c时间。决策树是通过关注影响决策的特定变量来应用的nal过程。与选定数据相关的整体评估预测[4]。一些变量的影响较弱,如年龄属性不显著不能而婚姻状况和性别是绩效评估的重要预测因素。工业应用中使用的许多算法eld但只有决策树给出了一个复杂的结果,无论是回归还是分类阳离子,因为我们使用了四种决策树算法来预测生产数据,所以,集成学习(bagging算法)用于部署所有算法以获得一个结果并改进预测。决策树在处理线性或非线性数据方面有很好的性能。然而,有一种算法的预测性能有限。许多算法用于对生产数据进行分类,但大多数结果精度低,标准误差大。

使用道具

报纸
何人来此 在职认证  发表于 2022-4-24 15:23:53 |只看作者 |坛友微信交流群
因此,决策树具有rmed在研究中解决了数据问题,因为它有许多优点:1。 决策树执行特征选择或变量筛选。2. 决策树不需要太多的计算用户用于准备数据的orts。3. 变量之间的非线性关系不是一个简单的问题这就是树的表现。4. 这很容易解释和解释。数据收集从利比亚纺织公司收集的12个属性和121个实例的数据。依赖或输出是一种评估;它被选为衡量每个工人表现的标准。变量或输入如下1。 操作员:负责生产和制造过程的工人。引用:Saad HR(2018)使用Bagging算法提高预测准确性,以评估生产公司的员工绩效。工业7:257。

使用道具

地板
能者818 在职认证  发表于 2022-4-24 15:24:00 |只看作者 |坛友微信交流群
doi:10.4172/2169-0316.1000257第7卷第2页o第2期o1000257Ind Eng Manage,一本开放获取的日志SN:2169-03162。 徽章编号:提供给每个工人的参考编号。3. 职位名称:特殊这项工作应该在生产中完成。4. 基本产量:e获得全额工资应达到最低产量。5. 实现的产量:实际产量。6. 奖励工资:如果工人超过基本生产量,则给予奖励。7. 生产率:e实际产量和基本产量之间的比率。8. 劳工局效率:责任主管对每个工人的绩效百分比(生产主管的评估不符合要求)高级管理层尚未批准)。 机器:这家公司有两种机器,一是旧机器(高质量和低生产率),二是新机器(高生产率和中等质量)。产品:公司生产我们有五种地毯,但最重要的是编织地毯。11经过的时间:一个特殊的《时代》杂志想制作一个样本cquantity。12e单元:公司有七个单元,每个单元都是为完成工作的一部分而设计的。因变量是一种评价。 如果工人的产量低于基本产量,管理层将只支付部分工资。2. 如果工人实现了基本生产,那么管理层将支付全额工资。3. 如果工人完成的产量超过了基本产量,管理层将支付全额工资和奖励。图1显示了用于预测评估的输入变量。Methodology任何数据挖掘算法的准确率都很低,而且许多记录或实例都是错误分类的然而,决策树在应用的算法中给出了最高的精确度。开始之前如表1所示,使用特征选择删除四个变量。ese属性降低了预测的准确性,对输出的影响很小。

使用道具

7
mingdashike22 在职认证  发表于 2022-4-24 15:24:07 |只看作者 |坛友微信交流群
四个决策树应用于classi然后使用bagging或投票算法部署决策树的所有算法,以给出一个预测结果。图2显示了该研究的方法学。投票或装袋算法(集成学习)集成方法大约在十年前作为一种单独的方法开始这是机器学习领域的一个领域,它的增强是因为需要增加多个算法的能力,而不是只信任建立在小训练集上的一个算法。经过十年的实验发展和重要理论研究,出现了几种技术,特别是增压和装袋技术,用于解决许多复杂的问题。然而,集成方法似乎也适用于在线应用和分布式数据挖掘的当前和未来问题[5]。Bootstrap聚合(Bagging)从原始训练集(使用带替换的采样)生成许多Bootstrap训练集,并使用它们中的每一个生成classi呃,包括在合奏中。e带替换的抽样模型EvaluaOnOperator工资No.职务标题Base Production Machinelabore效率Production Rate生产单位失效时间激励工资实现的生产图1:输入变量classi根据评估过程进行评估。引用:Saad HR(2018)使用Bagging算法提高预测准确性,以评估生产公司的员工绩效。工业7:257。doi:10.4172/2169-0316.1000257第7卷第3页o第2期o1000257开放存取日志IND Eng Manage SN:2169-0316数据收集过滤器替换缺失数据准备好了吗?NONOYESSolve dataCHAIDI-TreebostedTreeRandomForestPMML1PMML2PML3PMML4Deploy rapidminer。

使用道具

8
kedemingshi 在职认证  发表于 2022-4-24 15:24:13 |只看作者 |坛友微信交流群
BaggingEvaluateOutputsReerrorsSmall?将参数设置为“是”,以跟踪影响变量确认结果并结束。图2:显示了研究方法。引用:Saad HR(2018)使用Bagging算法提高预测准确性,以评估生产公司的员工绩效。工业7:257。doi:10.4172/2169-0316.1000257第7卷第4页o第2期o1000257Ind Eng Manage,一个开放访问日志SN:2169-0316变量。决策树算法将根据评估级别预测关系和相互作用[7-10]。结果与讨论四种决策树的精度很高,标准误差很小,有助于接受每种算法的结果。决策树的策略依赖于分割数据,直到得到一个纯子集。从结果来看,每种算法都得到了高概率的纯子集。表2显示了从每个决策树得到的小错误率。数据分类根据三个等级进行教育:一般、良好和优秀。大多数数据都是正确编辑和非常小的数据ed.对于121名工人的数据,每个工人都需要得到正确的评估。使用装袋或投票算法,我们得到了一个复杂的Classi结果如下:评价为平均值,总平均值为27,预测平均值为27。

使用道具

9
大多数88 在职认证  发表于 2022-4-24 15:24:21 |只看作者 |坛友微信交流群
评价为良好,总良好率为62,预测良好率为62。评价为优秀,总优秀30人,投票预测优秀29人;只有一个例子classi小姐ed.Bagging算法如下表所示,通过在一个模型中部署所有决策树来给出一个预测结果,达到了99.16%的最高准确率。总结频率表在该表中,我们根据每个级别(平均、良好、优秀)划分准确度,以根据频率显示哪个级别的预测最高。增益哈茨e增益图是准确预测与di类别响应总数的比率不同的百分位数。它显示了与基线相比的模型性能;给出了算法性能指标。所以,增益图显示了正确分类的观测百分比对给定类别的评分为平均、良好和优秀(图4)。在增益图中,我们需要最大化曲线和基线之间的距离。对于一般和优秀的classi阳离子,CHAID模型给出了基线和曲线之间的最高间距,而对于Goodclassi阳离子,穷举CHAID模型给出了基线和曲线之间的最高间距。因此,最好的性能来自CHAID和详尽的CHAID模型(表3)。受试者操作特征(ROC曲线)由于图3所示的所有值和装袋,研究中的所有决策树都给出了一个极好的测试。对于这些型号。(T) ,它是(N)示例的专业培训集。(M) ,它是要学习的基本模型的编号。(Lb),这是模型学习的基础。e hi是基础模型。(a,b)的Random_integer是以相等概率返回a到b的everyinteger的函数。

使用道具

10
mingdashike22 在职认证  发表于 2022-4-24 15:24:28 |只看作者 |坛友微信交流群
此外,(I(A))是指示函数,如果A为真,则返回1,否则返回0[6]。这项研究使用了四种类型的决策树1。 随机森林树木。2. 促进树木生长。3. 交互式树(CART和CHAID)。(车在哪里)阳离子和回归树,以及(CHAID是Chisquared自动交互检测器)。 查德树。(其中CHAID是卡方自动交互检测器)。功能选择选择功能通过忽略Low-e来提高准确性导致数据分类准确性降低的变量阳离子。在这项研究中应用了许多算法,但精确度分别不超过65%和71%,因此这种精确度不足以帮助做出正确的决定。我们认为一些属性在预测中不起作用,应该从数据集中删除。根据特征选择结果,删除了四个属性(单位、产品、运行时间和机器)。功能选择如表1所示。根据p值和卡方值删除变量。在这之前,管理层无法预测谁应该获得部分工资、全额工资或全额工资加激励的正确决策,因为图3:批量打包算法和抽样替换之间没有明确的关系或相互作用。Boost TreeModel CHAID模型穷举CHAID模型随机森林模型错误率0.025210 0.00 0.025210 0.042017表2:每种算法的错误率。卡方P值变量编号器242.0000 0.000000 1职务30.1333 0.000000 3徽章编号。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-30 21:12