楼主: ALEXSONG_JY
731 1

[学习笔记] 【学习笔记】- 获取数据 - 了解数据 - 缺失值,异常值 - 诈骗交易 ... [推广有奖]

  • 39关注
  • 2粉丝

博士生

72%

还不是VIP/贵宾

-

威望
0
论坛币
2458 个
通用积分
458.3493
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
3061 点
帖子
257
精华
0
在线时间
26 小时
注册时间
2020-6-15
最后登录
2020-11-6

楼主
ALEXSONG_JY 发表于 2020-9-21 12:32:06 来自手机 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
- 获取数据
    - 了解数据
    - 缺失值,异常值
    - 诈骗交易与正常交易在发生时间点上的不同
    - 诈骗交易与正常交易在交易金额上的不同
- 数据探索(业务理解)   
    - 查看y标签是否均衡-->不均衡-->权重参数/采样
    - 探索X与y的关系,得出简单结论,并为特征工程做准备
        - 交易类型与诈骗的关系-->诈骗仅仅发生在 TRANSFER 和 CASH_OUT
        - 交易客户名字与诈骗的关系-->没有太大的关系,剔除
        - isFlaggedFraud都为0-->剔除
- 数据处理
    - 去除重复样本,重复样本会引起预测偏移
    - 变量编码
    - 交易前后收款方余额都是0,而这笔交易本身不为0的样本比率-->诈骗极多(48.34%),正常交易只有0.17%。可能就是金融诈骗的迹象
        - 将交易前后来源方余额都是0,而这笔交易本身不为0的交易,交易前后余额均由0变为-1。
    - 交易前后来源方余额为0,而交易金额不为0。金融诈骗发生的比率反而很低(1.14%),正常交易却有47.60%。
        - 交易前后来源方余额都是0,而这笔交易本身不为0的交易,交易前后余额均由0变为1
- 特征工程
    - 变量衍生
- 模型选择
    - 平衡样本-->过采样(SMOTE)
    - 模型训练(交叉验证,网格搜索)
- 模型评估
    - AUC值
    - 混淆矩阵
- 结论报告
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:学习笔记 异常值 习笔记 缺失值 transfer

沙发
512661101 发表于 2020-9-21 21:38:41 来自手机

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-6 20:37