楼主: cdjxz
3194 1

[学习分享] 分位数回归 [推广有奖]

  • 0关注
  • 0粉丝

大专生

23%

还不是VIP/贵宾

-

威望
0
论坛币
1025 个
通用积分
0.3450
学术水平
0 点
热心指数
2 点
信用等级
2 点
经验
1838 点
帖子
25
精华
0
在线时间
50 小时
注册时间
2016-4-23
最后登录
2022-6-1

楼主
cdjxz 在职认证  发表于 2018-12-7 16:02:17 |只看作者 |坛友微信交流群|倒序 |AI写论文
相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
为什么做分段函数
在线性回归模型中,当X作为特征变量对因变量Y的影响趋势非线性,用普通的线性回归往往无法捕捉到。

一种方法是可以使用特征变量的多项式作为预测变量,可以得到在X取值的空间全局皆非线性的拟合函数。

但如果不希望得到全局的模型,希望每一段的变化斜率可以被表达出来,那么则可以使用分段函数。

如何做分段函数
这里,把X的取值范围分成一些区间,对每个区间拟合一个函数,相当于讲一个连续变量转换成多个有序的变量。

在X取值空间上创建分割点C1,C2,...,Ck,构造k+1个新变量如下(在R的实现)Rcode如下
  1. x<-c(1:100)
  2. y<-log(x)
  3. #线性模型拟合
  4. linear_fit<-lm(y~x)
  5. #分段拟合:5、10、20、50作为分割点
  6. stage_fit<-lm (y~  I(x<=5) + I((x<=5)*x)
  7.               + I(x>5 & x<=10) + I((x>5 & x<=10)*x)
  8.               + I(x>10 & x<=20) + I((x>10 & x<=20)*x)
  9.               + I(x>20 & x<=50) + I((x>20 & x<=50)*x)
  10.               + I(x>50) + I((x>50)*x))
  11. summary(stage_fit)
  12. qplot(x,y)+geom_line(aes(x, fitted.values(linear_fit)),colour=2)+geom_line(aes(x, fitted.values(stage_fit)),colour=3)
复制代码


004357vne4dzyrd4bxtn74.png


其中,是示性函数,条件成立返回1否则0。这样的定义的变量有时候也可称为哑变量。要带上数值可以进一步调整运算如

需要注意的是,如果想要分段拟合的效果好,必须考虑每段回归的截距不同,所以在每段回归需要加上相应的示性函数



分位数回归研究资料: 【高清PDF】分位数回归模型_[美]郝令昕_中文_翻译版.pdf (14.33 MB, 需要: 10 个论坛币)


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:线性回归模型 分段函数 线性回归 特征变量 取值空间

已有 1 人评分论坛币 收起 理由
cheetahfly + 30 奖励积极上传好的资料

总评分: 论坛币 + 30   查看全部评分

沙发
浅色的蓝 学生认证  发表于 2019-2-19 22:10:18 |只看作者 |坛友微信交流群
敢问楼主,看图也并没有实现分段啊?

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-27 03:14