在北京租房市场上,如果你想租房,主要有这么三种方式:
1、找房屋中介公司 目前市场占有率最高的公司,名叫链家;
2、找长租公寓 目前市场占有率最高的,名叫自如;
3、上找房平台 目前市场占有率最高的,第一是安居客。而今年4月有一家新上线的公司,异军突起极速窜到了前五位,名叫贝壳找房;
这三种方式加起来,几乎决定着你我租房的价格,而更让人惊讶的是,上述几家公司,除了安居客以外
链家、自如、贝壳找房,他们的实际控制人,是同一个人。这就是这几天频繁出现在新闻中的链家集团的老板---左晖
程序猿Zero哥向我爆料的,我和Zero哥很多年没见,我只隐约记得他做的糖醋排骨超级好吃
但是前几天他突然来找我,他说,他打算来北京发展,没想到遇上了一波房租上涨,就觉得很气,于是他用程序员的方式,扒了扒房租上涨背后的事情,我的反应是:啥是程序员的方式??
总之,在我的强烈要求下,Zero哥在公开合法的基础上,向我展示了他的调查过程,北京的空房子都在谁手上?首先,如果我们要搞清楚,是谁在控制租房市场,那就必须要搞清楚一件事:
北京有多少可供出租的房源?它们都在谁的手上?要调查北京可供出租的房源,可以查询政府的登记信息
这么重要的信息。Zero哥本来以为北京市规划国土委,应该有统计和公示,于是我们登陆了北京市规划国土委的官网
但是翻遍了这个网站,却没有找到这样的数据。也就是说,北京市规划国土委并没有公开
可供出租的房源信息那么其他部门会不会有这个数据呢?我们立刻想到最近北京房租的事情引起了不小的争议
于是自如、相寓和蛋壳,被相关部门约谈整改
我们注意到,这个相关部门名叫北京市住房和城乡建设委员会也就是北京住建委,看来这是租房行业的监管部门了于是我们来到了该委员会的官方网站
可惜的是,我们在这个网站上,看到了很多年度报表和其他数据,但是其中却没有关于租房房源的数据
那么,房源数据到底在哪里能看到呢?Zero哥的调查结果是租房行业中有一个号称掌握了最全的真实房源数据的项目叫“楼盘字典”
这个“楼盘字典”从2008年
开始打造如今据称已经有超过1200TB的数据量,目前记录在库的真实房屋数已经突破1亿。但是,这个数据从未对外公开不仅没有公开过它还是属于一个私人企业的这个企业正是链家,链家自己投资了6个亿来做这个项目
被投资人认为是比它旗下的20万经纪人更值钱的资产。我们甚至不知道政府是不是掌握这些数据
总之,行业内公认的是目前所知的最全的真实房源数据掌握在链家的手上,于是到这里为止以合法的手段关于房源的调查就戛然而止了好在,我和Zero哥很快想到了新思路:我们能不能从租客可以租到的房源来推测北京的房源情况?再通过查看从谁手上可以租到这些房子来推测房子在谁手上?于是我们调查了一下北京租房的市场对租客来说目前主要有这么三种渠道可以租到房子:
1、房屋中介公司;
2、长租公寓;
3、找房平台;
我们一项一项来调查一下首先是,房屋中介公司Zero哥首先查询到根据链家自己在各种网站上的介绍链家占据了北京70%的中介市场是北京最大的房地产经纪公司
顺着这个信息我们决定查一下,链家的手上有多少可供租房的房源,于是Zero哥用php写了一个爬虫用它爬取了一下链家的数据Zero哥的爬虫是这样做的:首先去控制台看加载信息,找到相关数据api,按照请求头里面的所需参数,发送https请求即可,分析完成后使用xpath或者正则表达式工具去匹配你想要的内容,然后插入数据库中,即可完成抓取。emmm...蛋蛋姐是没听懂。总之就是Zero哥爬取到了链家网上今天可以看到的所有待租的房子