主页>数据教育>智能数据新闻、文章和教育>什么是 KNN 分类以及该分析如何帮助企业?
什么是 KNN 分类以及该分析如何帮助企业?
通过卡蒂克帕特尔 2021 年 6 月 18 日
点击了解更多作者信息 卡提克·帕特尔.
在本文中,我们将讨论 KNN 分类方法的分析。
什么是 KNN 分类算法?
KNN(K Nearest Neighbors)算法分析所有可用数据点并对这些数据进行分类,然后根据这些已建立的类别对新案例进行分类。它对识别模式和估计。假设我们想根据两个预测变量(年龄和贷款类型)确定贷款违约的可能性,其中“违约”是目标。
我们将首先确定 K = 最近邻居的数量(根据距离)来检查类别分配。然后我们将计算一个实例与所有训练实例之间的距离。然后我们将按距离对实例进行排名并找到最近的邻居。换句话说,我们会找到与新实例的最短距离。之后,我们将收集最近邻居的类以找到大多数。这个类的大多数是一个类的最终预测值。
让我们看一个基于两个属性的 KNN 分类示例:耐酸度和强度。目标是将纸巾分为好/坏质量等级。
图片来源:优雅的微网
由于多数类 = 对三个最近邻的好(三分之二的记录有类 = 好),实例的预测类 = 好,即耐酸度 =3 和强度 = 7 的纸巾质量好.
KNN 分类如何帮助企业?
KNN 分类分析可用于评估多种类型的数据。
信用/贷款批准分析:给定客户交易属性列表,企业可以预测客户是否会拖欠银行贷款。
天气预报:根据温度、湿度、压力等,组织可以预测是否会下雨/晴天/寒冷。
欺诈分析:根据员工提交的用于报销食品、旅行和其他费用的各种账单,企业可以预测欺诈的可能性。
让我们看两个用例来说明 KNN 分类的好处。
用例 1
业务问题: 银行信贷员希望根据贷款金额、每月分期付款、工作期限、拖欠付款次数、年收入等属性来预测贷款申请人是银行违约者还是非违约者。债务与收入比率等。这里,目标变量将是“过去的违约状态”,预测类别将分别包含代表“可能违约/不太可能违约”类别的值或“是或否”。
商业利益: 一旦分配了类别,银行将拥有一个贷款申请人数据集,每个申请人都被标记为“可能/不可能违约”。根据这些标签,银行可以根据风险大小轻松决定是否向申请人提供贷款以及每个申请人的信用额度和利率。
用例 2
业务问题: 医生希望根据血压、血红蛋白、血糖、给予患者的药物名称、给予患者的治疗类型等各种属性来预测新患者治疗成功的可能性,在这里,目标变量将是“过去的治愈状态”,而预测的类别将包含值“是或否”,分别表示“容易治愈/不易治愈”。
商业利益: 鉴于患者的健康和身体状况以及最近为患者开出的治疗和药物,医生可以预测概率并就治疗/药物的变化提出建议。
KNN 分类算法在确定可能的结果和结果以及预测和预测结果,给定多个变量的存在。
相关帖子DA内容精选
|


雷达卡



京公网安备 11010802022788号







