楼主: Tigflanker
814 2

[问答] 想和各位请教一个预测的问题 [推广有奖]

  • 8关注
  • 18粉丝

副教授

49%

还不是VIP/贵宾

-

威望
0
论坛币
2321 个
通用积分
9.8528
学术水平
179 点
热心指数
194 点
信用等级
167 点
经验
27443 点
帖子
622
精华
0
在线时间
851 小时
注册时间
2011-3-27
最后登录
2023-5-14

200论坛币
请先看下这张表:
日期地区类别1类别2需预测的量

1

北京

1000

50

10+5

1

上海

2000

100

30

1

广州

3000

150

45

2

北京

2000

100

30

2

上海

3000

150

45

2

广州

4000

200

60

3

北京

3000

150

?

3

上海

4000

200

?

3

广州

5000

250

?

假设我有这样一张表,想要通过几个连续型变量:类别1+类别2的值预测另一个连续型变量
是通过前面的一段时间(训练集)预测后面的一段时间

需要预测的量,我知道大概是这么一个形式:类别1 × 类别1的缩小率 + 类别2 × 类别2的缩小率
大致这样估计的,不过我只有一个加完的值(15、30、45、30、45、60),无法得到细的分类

我现在的做法是:
proc reg data = data;
  by orgid;
  model 需预测的量 = 类别1 类别2 week1 - week7/*哑变量*/       / selection = stepwise ;
run;quit;


取得估计到的参数,拼成线性式,
但是出来的值,不太理想;而且还估出来负值

不知各位老师,有没有更合适的方法?在线等,谢谢

最佳答案

YLF870214 查看完整内容

你这样是无法用线性模型解决的,线性模型出来参数太死,而且很容易出现过拟合;如果是做预测的话,建议直接单独按照最小颗粒度估算过度因子,最后在按照正向累加的方法将结果加和,这样至少不会出现你说的负数。
关键词:Selection stepwise Election Select 连续型变量 北京 广州 上海
Bye SAS.
若有缘,能重聚。
沙发
YLF870214 发表于 2016-12-14 16:31:28 |只看作者 |坛友微信交流群
你这样是无法用线性模型解决的,线性模型出来参数太死,而且很容易出现过拟合;如果是做预测的话,建议直接单独按照最小颗粒度估算过度因子,最后在按照正向累加的方法将结果加和,这样至少不会出现你说的负数。
已有 2 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
李会超 + 100 精彩帖子
Tigflanker + 5 + 4 + 4 + 4 一个月终于有人回了,新年快乐

总评分: 经验 + 100  论坛币 + 5  学术水平 + 4  热心指数 + 4  信用等级 + 4   查看全部评分

使用道具

藤椅
Tigflanker 发表于 2017-1-23 22:43:10 |只看作者 |坛友微信交流群
YLF870214 发表于 2016-12-14 16:31
你这样是无法用线性模型解决的,线性模型出来参数太死,而且很容易出现过拟合;如果是做预测的话,建议直接 ...
终于有人回了,我去

目前也是大致这么做的,不过我绕了个弯子,业务上避免了这种情形;
当时看来太钻牛角尖了

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-2 06:13