楼主: 时光永痕
755 0

[数据挖掘新闻] 什么是朴素贝叶斯分类以及它如何用于企业分析? [推广有奖]

  • 0关注
  • 14粉丝

svip3

学术权威

12%

(VIP/贵宾)八级

3%

威望
0
论坛币
26 个
通用积分
57.2238
学术水平
4 点
热心指数
4 点
信用等级
4 点
经验
34180 点
帖子
2732
精华
0
在线时间
321 小时
注册时间
2020-7-21
最后登录
2024-8-1

楼主
时光永痕 学生认证  发表于 2022-6-1 13:32:17 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
什么是朴素贝叶斯分类?

朴素贝叶斯是一种适用于二分类和多分类的分类算法。它是一种监督分类技术,用于通过使用条件概率将类标签分配给实例/记录来对未来对象进行分类。在监督分类中,训练数据已经被标记了一个类。例如,如果欺诈交易已被标记交易数据如果我们想将未来的交易分类为欺诈/非欺诈,那么这种类型的分类将被称为监督。


假设我们要对水果进行分类。如果水果是红色的、圆形的、直径约 3 英寸,则可以认为它是苹果。如果我们有 1000 片水果的数据,包括每个水果的特征或特性,我们可以对 1000 片水果的形状、长度、颜色、甜度、酸度等特征进行分类。


图片来源: 优雅的微网
当我们查看上表时,我们看到 50% 的水果是香蕉,30% 是橙子,20% 是其他类型的水果。

朴素贝叶斯分类器假设每个特征/预测变量都是独立的,但情况并非总是如此,因此在选择此分析技术或任何其他分析技术之前了解您正在分析的数据类型非常重要。

为了充分利用朴素贝叶斯方法,训练数据集应该足以代表整个人口——包含类标签和属性的每个组合。与数值变量相比,朴素贝叶斯在分类输入变量的情况下表现良好。对于数值变量,假设正态分布,这是一个强假设。

朴素贝叶斯如何用于企业分析?
这种技术可用于评估许多应用程序。

天气预报:根据温度、湿度、压力等,组织可以预测明天是否有雨/晴天/有风。
欺诈分析:根据员工提交的各种报销食品、旅行等支出的账单,企业可以预测欺诈的可能性。
用例 1
业务问题: 银行信贷员希望根据贷款金额、每月分期付款、工作期限、拖欠次数、年收入、债务收入比等属性来预测贷款申请人是银行违约者还是非违约者等等。这里的目标变量将是“过去的默认状态”,而预测的类别将包含值“是或否”,分别代表“可能默认/不太可能默认”类别。

商业利益: 一旦分配了类别,银行将拥有一个贷款申请人数据集,每个申请人都被标记为“可能/不可能违约”。根据这些标签,银行可以轻松地决定是否向申请人提供贷款以及每个申请人有资格获得多少信贷和利率。

用例 2
业务问题: 医生希望根据患者的各种属性(例如血压、血红蛋白水平、血糖水平、给予患者的药物名称、类型)来预测成功治疗患者疾病或状况的可能性给予患者的治疗等。这里的目标变量将是“过去的治愈状态”,预测的类别将包含值“是或否”,分别表示“容易治愈/不易治愈”。

商业利益: 考虑到患者的健康和身体状况以及最近使用的治疗和药物,可以预测治愈的可能性,如果需要,可以建议改变治疗和药物建议。

朴素贝叶斯是一种适用于二分类和多分类的分类算法。与数值变量相比,朴素贝叶斯在分类输入变量的情况下表现良好。它对做出预测和基于历史结果的预测数据。

      相关帖子DA内容精选
  • 大厂数据分析面试指南!来自亚马逊、谷歌、微软、头条、美团的面试问题!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:朴素贝叶斯 贝叶斯分类 企业分析 如何用 贝叶斯

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-21 04:44