楼主: dinguangx
3036 15

[原创博文] 利用回归模型给房屋定价 [推广有奖]

  • 0关注
  • 0粉丝

已卖:24份资源

初中生

42%

还不是VIP/贵宾

-

威望
0
论坛币
96 个
通用积分
0
学术水平
5 点
热心指数
4 点
信用等级
5 点
经验
403 点
帖子
14
精华
0
在线时间
10 小时
注册时间
2012-10-30
最后登录
2019-1-4

楼主
dinguangx 发表于 2013-1-13 21:32:00 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

       事情是这样的:有一个房主,他想把自己的房子给卖掉,但是不知道该标怎样的一个价格才合适。但是他很聪明,可能还有点数据预测的经验,所以就找到房屋中介,看了一下附近的房子都是怎么定价的。很明显的是,房屋中介有很多附近的房屋信息和出售价格,并且告诉这个房主房子的价格是跟房子的房屋面积、占地大小、卧室数量、厨房是不是花岗岩的、以及卫生间是否重装等等因素有关系的,并且给了他一份附近房屋的相关资料。然后这个房主听了中介的话,回去把自家房屋的这些信息也给整理了一下,最终形成了下面的表格(很明显这不是我国的房子,我们能有个2室,90平方就知足了,哪敢要这么大的房子):(数据来源:http://www.ibm.com/developerworks/cn/opensource/os-weka1/)

表 1. 回归模型的房屋值

房子面积(平方英尺)占地的大小卧室花岗岩卫生间有无重装?销售价格
35299191600$205,000
324710061511$224,900
403210150501$197,900
239714156410$189,900
22009600401`$195,000
353619994611$325,000
29839365501$230,000
31989669511????



这个房主拿到这份数据之后,就开始打开SAS对这份数据进行回归分析了,代码很简单:
  1. libname sas 'd:/workspace/workspace_sas';
  2. data sas.task10_03;
  3.         input x1-x5 y @@;
  4. cards;
  5. 3529 9191 6 0 0 205000
  6. 3247 10061 5 1 1 224900
  7. 4032 10150 5 0 1 197900
  8. 2397 14156 4 1 0 189900
  9. 2200 9600 4 0 1 195000
  10. 3536 19994 6 1 1 325000
  11. 2983 9365 5 0 1 230000
  12. ;
  13. proc stepwise;
  14.      model y = x1-x5;
  15. run;
  16. quit;
复制代码

就是对5个变量进行逐步回归,看看它们跟最终的定价是否有相应的关系 。主要是来看SAS的运行结果:
0-1.png

0-2.png

0-3.png

0-4.png

0-5.png

0-6.png

0-7.png





SAS这工具,别的没啥,就是输出结果多,要慢慢看,逐步分析:
1. 逐步分析的第一步,引入对结果影响较大的x2,即占地大小,其Pr值为0.0362<0.05,不剔除。2. 第2步,引入变量x3,即卧室数量,其Pr=0.1269<0.15,不剔除,此时变量x2的Pr=0.0462,继续保留。3. 第3步,引入变量x5,即卫生间有无重装,其Pr=0.0790<0.15,不剔除;此时变量x2和x3的Pr值分别为0.0214和0.0561,继续保留。4. 第4步, 引入变量x1,即房子的面积,其Pr=0.0960<0.15,不剔除;此时变量x2、x3、x5的Pr值分别为0.0171、0.0275、0.0299,均小于0.15,继续保留。
至此,结果分析完了,房主得到了一个回归方程:y=-21661-26.68824x1+7.05512x2+43166x3+43392x5。

然后算了一下自己的房价,-21661-26.68824*3198+7.05512*9669+43166*5+43392*1=220427。 大约值22万美刀!


结果是分析完了,可是房主却郁郁寡欢了,本来以为房子面积越大越值钱呢,最终的结果却是面积越大,越不值钱(因为这里x1的系数是-26.68824 ,尼玛,居然负相关的);再看一下卧室的数量,卧室越多,越值钱。房主这样真心是凌乱了,正想着要不要把房子给砸掉一半,让房子面积小一些。同时再把原来30平方的卧室全给隔成10平方的卧室呢,不过这笔装修费还是要出的,元芳们,你们觉得这样干可以不?


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:回归模型 WORKSPACE developer stepwise libname 房屋 模型

沙发
chc349 发表于 2013-1-13 21:53:29
本人认为计量不可靠,严重脱离实际

藤椅
jiushou1234 发表于 2013-1-13 21:55:43
最讨厌纯粹的经济模型,根本解释不了复杂的问题。却非要做什么模型分析。。。。。有本事把买家的不理性和信息不对称性也加上啊。。。

板凳
dinguangx 发表于 2013-1-13 21:57:41
chc349 发表于 2013-1-13 21:53
本人认为计量不可靠,严重脱离实际
做为一个初学者,也对这些工具的实际应用场景抱有一定的疑虑之心,但是不用它,只用常识的话,很多实际问题也不用解决。

报纸
dinguangx 发表于 2013-1-13 21:57:43
chc349 发表于 2013-1-13 21:53
本人认为计量不可靠,严重脱离实际
做为一个初学者,也对这些工具的实际应用场景抱有一定的疑虑之心,但是不用它,只用常识的话,很多实际问题也不用解决。

地板
dinguangx 发表于 2013-1-13 21:59:25
jiushou1234 发表于 2013-1-13 21:55
最讨厌纯粹的经济模型,根本解释不了复杂的问题。却非要做什么模型分析。。。。。有本事把买家的不理性和信 ...
如果模型分析都能把所有的因素都考虑到,尤其是一些人为的因素都加进去的话。统计学的同志们,程序员们 都可以转行去做股票分析了。

7
BenBenLu55799 发表于 2013-1-13 22:03:32
理论与现实的距离,有多远,模型上面感觉考虑的因素过于牵强。所以得出的结果也不太理想,其实不是说计量不靠谱只是我们还没发现数量间更好的规律。

8
nkunku 发表于 2013-1-14 09:06:43
作为一个例子,向同学们引入sas的逐步回归概念,还是不错的呀。对错可暂且不管,引导学生产生兴趣,才是好的。
特别是对于目前的回归结果与实际不符,让同学们明白,回归不是万能的,因为有许多其他重要的因素当考虑在内。

9
柳如清风 发表于 2013-1-14 13:59:52
数据样本太少了,缺少统计意义,而且结果中的p值比较大
已有 1 人评分学术水平 收起 理由
2015 + 1 分析的有道理

总评分: 学术水平 + 1   查看全部评分

10
dinguangx 发表于 2013-1-14 21:25:12
nkunku 发表于 2013-1-14 09:06
作为一个例子,向同学们引入sas的逐步回归概念,还是不错的呀。对错可暂且不管,引导学生产生兴趣,才是好的 ...
已经发现了存在的问题:
1. 在step2的时候,截距对结果的影响已经失去意义,应该抛弃截距再来计算
2. 自变量与因变量是否符合线性关系没有事先确认。

看来对于初学者,想要把理论结合实际,还有很长的路要走的
已有 1 人评分学术水平 收起 理由
2015 + 1 我很赞同

总评分: 学术水平 + 1   查看全部评分

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-31 22:07