机器学习与供应链管理
程晓华
2023-4-16
【编者按】我近期在“国家智慧教育平台-研究生教育”频道学习北京邮电大学艾新波老师的《R语言数据分析》,其中有个作业,要求如下:
“如何发挥人工智能的头雁效应”讨论:
习近平同志指出,“人工智能是引领这一轮科技革命和产业变革的战略性技术,具有溢出带动性很强的‘头雁’效应。”“加快发展新一代人工智能是我们赢得全球科技竞争主动权的重要战略抓手,是推动我国科技跨越发展、产业优化升级、生产力整体跃升的重要战略资源。”
(1)请结合自己的观察,举出人工智与经济、政治、文化、社会、生态等融合的若干具体案例(至少一个,请勿与他人重复),分析一下这个案例中:①基于哪些数据;②采用了哪些模型;③如何发挥促进和支撑作用。
(2)除了已经观察到的既有案例,还有没有自己能想到的结合点。如果有好的想法,请与大家分享。
以下是我的作业:
艾老师及各位同学,你们好,我的作业题目是“机器学习与供应链管理”,因为我一直在制造业、咨询业从事供应链管理工作。
在实际工作中,我想我们应该可以用到很多机器学习的知识和方法来解决供应链管理问题。我在这里跟大家分享两个具体的例子,希望老师和同学们批评指正。
例一:运用无监督学习的kmeans算法进行客户分类。
用到的数据都可以是来自企业的CRM(客户关系管理)及ERP(企业资源计划系统),具体是:客户代码、下单时间、每次下单的采购金额等。
利用这些数据我们就可以完成RFM(Recency-最近, Frequency-频率, Monetary-花费 )客户分类模型的原始数据整理及特征提取工作。在此基础上,运用kmeans算法对客户进行任意分类。
随着企业CRM/ERP数据的不断增加,我们可以定期运行R语言程序以更新客户分类。其输出结果对于我们做进一步的客户分类(增加其他非量化特征)可以打下坚实的量化基础。
例二:运用监督学习的randomForest算法进行投标成功率分析与预测。
企业经常参与不同客户的投标,投标成功与失败对企业经营影响巨大。但由于每次投标,不同的客户要求不一样,有的客户关注价格多一些,有的客户可能关注交付周期多一些,而有的客户则是对我们要求的付款周期比较敏感。但其实每次投标前,我们并不知道这次客户更加关注什么,即决定投标成功率的关键因素到底是什么,它们的权重大概有多大。
基于历史数据记录,我们可以运用randomForest进行建模分析并对每次投标组合进行预测。我们能用到的具体数据包括:计划的利润率、应收款天数、要求的付款周期及是否成功等。
同样,随着投标次数的增多,我们可以积累的数据越来越多,我们预测的投标成功率也就会越来越高。
其他应用:
能做客户分类,当然就能做供应商分类、物料分类等等 – 分类管理在供应链管理当中一直占据着及其重要的位置。在供应链管理中,我们能用到的算法除了以上提到的kmeans及randomForest,还有主成分分析算法prcomp及决策树分类法rpart等等。
【编后语】我理解的机器学习(Machine Learning,ML)是通过不同的算法(如回归、分类、聚类等)挖掘出数据背后隐含的模式,即建立Y=f(Xi)函数关系,然后利用该函数对未来做出预测(连续值或概率)或判断(类别)。其中的Xi是已知数据的各个特征,如销售价格、广告费用、品质、时间等等,是自变量,而Y则可能是我们感兴趣的销售量(额)等,属于因变量。在自变量较多、数据规律并不明显的前提下,依靠我们传统的数据分析方法,要想建立Y=f(Xi)之间的关系几乎是不可能的,而对于机器学习来讲则是简单的很,尽管,机器学习也不是万能的,它也牵扯到一个模型的泛化能力问题,即:利用历史数据,通过机器学习算法建立的模型也不一定能够很好的预测未来。但是,可以肯定的是,它比一般的数据分析要“智能”的多,预测准确性也要高一些。同时,随着大数据的积累,机器可以学到更多的知识,其预测、判断能力会得到进一步加强。最关键的是,通过对“R语言及机器学习”的学习,我们可以学到很多数据分析及解决问题的方法论,我想这可能比通过机器学习得到一个好的预测结果更有意义。
另外,我个人认为,机器学习也属于统计预测的范畴,但是,它比一般的统计预测要更高级一些,它的数学理论基础也不仅仅是统计学。
作者程晓华(John Cheng),全面库存管理(TIM)咨询独立顾问,《制造业库存控制技术与策略》课程创始人、讲师,《制造业库存控制技巧(第1/2/3/4版,第5版预计2023年6月上市)》、《首席物料官》、《决战库存(大陆及港台版)》、《制造业全面库存管理》、《全面库存管理数学分析》著作者。 TIM订阅号:ITOOTD,邮箱: chengxiaohua@pku.org.cn