|
A 股有2400 支股票:如以年为研究之:2400个观察
以季为研究之:2400*4个
以月y为研究之:2400*12个
以日为研究之:2400*250个
以小时研究之:2400*250*4
以5分钟研究之:2400*250*4*12
Big data 就是这样产生的???
再考虑以变量:x1,x2,...........
x1*x2,x2*x3..........
x1*x2*x3,x2*x3*x4...........
f1(x1,x2,....),f2(x1,x2,...)..........
.............................................
如此便为“无限量数据”
如果我们不限制我们的研究范围,我们实质早已到了“无限量数据”时代,
但是,不限制研究范围,按学习理论,我们是不可能学的,如VC 理论所认证的
如果数据来自同一分布:我们只要抽取10%,1%或0.1%既可学 大数据也变成小数据
如果数据分布如同鬼怪出没不定,学习又有何用。。。
|