楼主: 万木青
3196 3

[问答] 神经网络、支持向量基建模时,对于类别型、有序型的输入变量该如何进行预处理? [推广有奖]

  • 4关注
  • 1粉丝

已卖:165份资源

博士生

8%

还不是VIP/贵宾

-

威望
0
论坛币
2895 个
通用积分
5.7446
学术水平
0 点
热心指数
2 点
信用等级
0 点
经验
2168 点
帖子
136
精华
0
在线时间
195 小时
注册时间
2014-10-20
最后登录
2021-4-12

楼主
万木青 发表于 2018-12-8 18:14:12 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
近期在学习神经网络和支持向量基,看了不少例子,基本上输入变量都是连续型,而实际应用场景中会出现不少类别型的输入变量,这些变量可能是标记型(是1/否0)、类别型(1、2、3代表几类)、有序型(1、2、3有序的类别),对于这些类型的变量在建模时又该如何处理?是转化为虚拟变量?还是?请专业前辈指点指点!或者推荐优秀书籍可供学习,万谢!
另有一疑问,本人在试验神经网络时,使用了SPSS modoler 一开始是将几种类型的变量都作为输入,末作任何预处理,最终模型自已选择出有影响的变量,基本都是连续型变量,预测准确率在78%。
当我只选择连续型的变量,并且对变量用极差法做归一化后再参与建模,有影响的变量出现较大变化,预测准确率下降为75%,但对于yes类的响应率都有显著的提升。是否应以第二种结果为准?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:预测准确率 连续型变量 支持向量基 神经网络 输入变量

telco.zip
下载链接: https://bbs.pinggu.org/a-2665543.html

51.58 KB

spss数据集

本附件包括:

  • telco.sav

沙发
jgchen1966 发表于 2018-12-8 18:47:23
这部分,是数据分析中,最艺术的部分,全凭工匠手艺之熟练程度。。一个主题词”Feature Engineering“,可查到一些有关这方面的书或研究论文。 是否有用,全凭你的经验!!!

藤椅
万木青 发表于 2018-12-8 21:45:00
jgchen1966 发表于 2018-12-8 18:47
这部分,是数据分析中,最艺术的部分,全凭工匠手艺之熟练程度。。一个主题词”Feature Engineering“,可 ...
谢谢前辈!看来这是要不断尝试并结合产出价值来决定的!

板凳
十七里香 发表于 2019-1-14 21:56:42
多谢多谢!!!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-4 07:33