你要买公寓吗?如何通过数据监控来破解房地产市场的竞争
在过去的几年中,房地产公司已将重点转移到数字世界,现在几乎所有投资都具有在线系统,以显示可提供的公寓。对于他们的潜在客户而言,这非常方便,因为他们可以轻松地熟悉所提供的公寓。当每周监视所有可用数据并分析销售进度时,事情变得很有趣。
为什么这个这么重要?由于销售动态是至关重要的数字,很少用数字来表示,因此它可以使您在谈判中占优势。了解动态,使您能够更好地计划随时间变化的现金流,并在短期内提高资产效率。
这项调查帮助我与波兰当前房地产市场的困境作斗争,并以更好的条件达成了公寓交易。
作为个人客户,您将如何受益?
您在价格谈判中还有其他优势。
您可以选择合适的时机进行购买。
您可以预测开发人员的下一步行动。投资成功了吗?他们会继续进行下一阶段吗?他们目前的财务状况如何?
另外,这种方法可以通过监控竞争对房地产公司有利吗?
您对给定位置的市场需求有第一手的了解。
您可以在竞争对手的销售过程中识别模式。
您可以更好地了解客户的需求。哪些类型的公寓销售更快?
监视华沙的位置之一后的示例结果
该投资建在华沙东部地区的普拉加·波杜尼(PragaPo?udnie)。这是一个潜力巨大的领域。当前,有许多公寓大楼和地方等待装修或更换。但是,它与市中心的交通十分便利(搭乘公共交通工具15分钟或驾车10分钟即可到达)。另一个优点是有很多景点,例如购物中心,公园,学校或医疗服务点。
以下是受监控投资的基本特征:
有135套公寓出售。
大楼有8层。每层有14至16套公寓。
投资从获得建设许可的空地开始,该场地的工作于2018年第一季度开始。计划的完成日期为2019年第四季度。
这位房地产开发商于2018年4月开始出售公寓。
从投资网站收集了第一笔数据之后,我们可以看到不同类型公寓的当前报价:
公寓类型
很高兴知道这一点,但是最有趣的数据来自对销售进度的定期监视。您可以在下面看到时间表,该时间表代表每周出售的公寓数量:
我们还能看到什么?例如,当前销售进度如何?
值得记住的是,该建筑始于2018年第一季度。目前,仅建筑物的地基已准备就绪,但几乎一半的公寓已售出。
预计出售所有公寓的日期
让我们看看按公寓类型划分的销售动态。我们还可以尝试对何时出售所有公寓做出简单的预测。
销售率动态
从该可视化中我们可以看到:
如果继续保持销售速度,几乎所有公寓将在2019年5月之前售出。这距离计划的施工完成日期还剩6个月。
但是,并非所有公寓都具有相同的销售动态。最快的公寓有1或2个房间。拥有4个房间的最大的公寓不那么受欢迎-仅售出3个。
潜在的买家改变主意了吗?他们可以获得抵押贷款吗?
另一个有趣的发现是关于已售出但后来又重新可用的公寓。发生这种情况的原因有多种。重要的是要了解销售过程的工作方式。在向银行申请贷款之前,买方必须与开发商签署协议。在正式签署公寓合同后,银行总是有可能拒绝您的贷款请求。买方也可以改变主意并出于其他原因退出。
在观察到的数据中,只有这样一种情况。带有独立厨房的两室公寓于2018年8月底售出,但在9月中旬再次可用。
数据抓取
收集有价值的数据进行分析是每个数据科学过程的基础。当数据来自外部在线资源时,方法之一就是数据抓取。此技术意味着通过网络搜寻器从网站“抓取”数据(其他名称为“机器人”或“抓取器”)。机器人将文本解析为机器可读的格式,因此可以对其进行分析。
一些网站受以下技术保护:
以动态方式(例如,使用JavaScript)显示内容或使网站结构复杂化,因此抓取工具很难解析。
使用验证码或其他机器人检测工具保护内容。
异常检测系统,用于分析请求之间的行为并禁止可疑访问者。
有些网站更难抓取。它们以动态方式(例如,使用JavaScript)显示内容或具有复杂的网站结构。在Appsilon,我们知道如何应对所有这些障碍。所有这些都使网页刮取变得更加困难,但并不是防弹的。任何数据刮取均应符合给定网站的使用条款和当地法律。在大多数情况下,除非您的机器人使用的带宽超过正常带宽或计算能力,否则网页抓取是合法的。
从投资页面收集数据
在本文所述的情况下,我监视了华沙的一个位置。房地产开发商正在使用在线系统在此位置出售公寓,该系统包含下表中的公寓可用性。
该系统没有任何验证码或异常检测保护。这里唯一的障碍是使用JavaScript动态加载内容,并且没有开放的API端点可以在其中请求数据。您只有在通过界面单击后才能查看数据。
解决方案是在界面上单击以模拟人类行为的网络爬虫。想象一下,您有一个机器人员工,他每周都会监视您所需的所有信息,不会感到疲劳或无聊,并且100%准确。
我使用了Google的Puppeteer.js技术;它可以在后台运行的浏览器中复制人类行为。这是刮板的源代码:
const puppeteer = require('puppeteer');
(async() => {
const browser = await puppeteer.launch();
const page = await browser.newPage();
await page.goto('https://real-estate-developer-address.com/'); // Real URL address is confidential
await page.click('#cbNotSale');
await page.waitFor(2000);
const nextSelector ='// input [contains(@alt,“>”)]')
var next =等待页面。$ x(nextSelector)
而(next.length> 0){
const单元=等待页面。$ x('/ / * [@ id =“ gwProducts”] / tbody / tr / td');
var vals = [];
var val = null;
for(var i = 0; i <cells.length; i ++){
val =等待page.evaluate(x => x.textContent,cells [i])
如果(val ==“ F1”)vals.push([] ); //识别行开头的最快(肮脏)方法。
如果(val ==“ zobacz” || val.trim()==“”)继续;//识别行尾的最快(肮脏)方法。
vals [vals.length-1] .push(val)
}
vals.forEach(row => {
console.log(row.join(“;”))//机器人将收集到的行打印到stdout
});
await next [0]
.click()await page.waitFor(2000);
next =等待页面。$ x(nextSelector)
}
等待页面。screenshot({path:'example.png'});
等待browser.close();
})();
我们可以使用以下命令运行搜寻器。只需将CRON或其他作业配置为每周运行一次即可:
node scraper.js > data-YYYY-MM-DD.csv
这只是可用于刮削的多种技术之一。让我们知道,如果您想从我们的经验中了解有关收集数据和其他业务案例的更多信息!
后果
作为私人投资者,我需要在投资方面表现出色。没什么好下注的地方,这就是为什么我使用牌组中所有可用的卡来确保自己以数据科学的力量做所有事情的原因。这项分析为我提供了有关投资财务状况的信息,并且我可以预测要为梦想中的公寓完成交易需要多少时间。我有更多时间做出最终决定,在谈判中我更有信心。请记住,在最可能的时刻购买公寓为您提供了短期选择,而不是立即冻结资金。我拥有其他买家没有的优势,因此我可以轻松解决有关公寓受欢迎程度的虚假声明,而不会有购买压力。每个销售过程都是知识分配不均的游戏。对销售动态的了解将使您与赔率作斗争并达成更好的交易。
1


雷达卡



京公网安备 11010802022788号







