楼主: 树袋熊2
4015 3

[问答] 大数据量的距离矩阵存储 [推广有奖]

  • 4关注
  • 4粉丝

已卖:464份资源

博士生

3%

还不是VIP/贵宾

-

威望
0
论坛币
336 个
通用积分
3.8492
学术水平
11 点
热心指数
19 点
信用等级
8 点
经验
4585 点
帖子
135
精华
0
在线时间
243 小时
注册时间
2011-3-9
最后登录
2023-9-20

楼主
树袋熊2 发表于 2013-10-14 17:29:52 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
我有一些带坐标的点数据,目的是计算这些点的距离矩阵,然后对计算出的距离做分组计数。用几千个点的时候dist()函数还能承受,到1万个点的时候(真不多),由于数据量为N*(N-1)/2,就到五千万级别了(就很多了),这个矩阵就超出了R的内存限制

我在网上找了好些处理大数据的方法,像R处理大数据的 ff、bigmemory 包和R连接数据库的方法看了好多介绍,还是不知道该怎么储存。所以发帖求助~

大家平时都是怎么处理大数据量的?有什么经验或资料可以推荐下?感激不尽!


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:距离矩阵 大数据 memory 连接数据库 SOSO 连接数据库 网上 资料

已有 2 人评分经验 学术水平 热心指数 收起 理由
ltx5151 + 20 鼓励积极发帖讨论
qoiqpwqr + 1 + 1 鼓励积极发帖讨论

总评分: 经验 + 20  学术水平 + 1  热心指数 + 1   查看全部评分

沙发
wxfwolf 发表于 2013-10-14 17:31:02
同求……
他灵魂的欲望就是他命运的先知。
在别人贪婪时恐惧;在别人恐惧时贪婪。
练就一颗敢死而又敢让人死的孤胆雄心!
我们这一代人,不光有乘凉的福,还有栽树的“命”!

藤椅
水天一色DIY 在职认证  发表于 2013-10-14 19:12:12
楼主提供的几种方法都是目前R软件解决较大数据量数据所常采用的方法,其中参考文献有很多,如《Managing large datasets in R》介绍了ff包实际案例

板凳
jiabiao1602 发表于 2013-11-6 10:34:22
bigmemory包我的windows xp系统装不了

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-31 03:05