楼主: 『‖佳‖』
1494 4

[学术与投稿] 关于大数据时代有些疑问 [推广有奖]

  • 1关注
  • 4粉丝

讲师

5%

还不是VIP/贵宾

-

威望
0
论坛币
264 个
通用积分
0
学术水平
6 点
热心指数
6 点
信用等级
6 点
经验
8873 点
帖子
136
精华
0
在线时间
683 小时
注册时间
2013-4-14
最后登录
2021-6-29

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
大数据时代强调样本就是总体,利用所有的数据来进行预测,强调相关关系。但是如果在分析数据的时候,比如说A变量对B有影响,B变量对C变量有影响,而A变量也对C变量有直接的影响,那么我们利用A、B变量的所有数据去分析C变量的时候,会不会造成数据的重复利用?而且大数据时代强调尽可能多用与变量有关的所有数据,这是不是会造成更多的数据重复利用?因为少量的变量还可以说把重复部分剔除,但是在大数据环境下似乎没有办法做到。最近在看大数据,可是脑子里一直存在这个问题,希望高人指点!谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:大数据时代 大数据 高人指点 相关关系 尽可能 而且 样本 影响

沙发
飞飞小雨 发表于 2013-9-4 16:26:51 |只看作者 |坛友微信交流群
不知道唉,感觉就像b和c都是a的函数,同时c也是b的函数,要把a和b之间的关系先关联好,再去分析c吧

使用道具

藤椅
yuhoucai 发表于 2013-9-8 14:48:32 |只看作者 |坛友微信交流群
这个相关性的还没考虑过

使用道具

板凳
wuyanyiai 发表于 2013-9-23 01:13:32 |只看作者 |坛友微信交流群
一般来说20%的数据反应了80%的信息,大数据似乎是为了得到20%的信息二区搜集利用80%的数据~

使用道具

报纸
whiteice 发表于 2013-9-23 11:58:59 |只看作者 |坛友微信交流群
个人感觉:样本就是总体。这句话值的深究。
样本是现阶段能够得到的个体,总体是所有个体构成的集合。
就像 太阳系的研究,不能说我们现在能观察到的个体就构成总体。
人在尘世间,心在三界外;若无纷繁事,何羡天上仙。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-26 12:56