楼主: bookbug
3863 2

[Stata高级班] STATA高级:怎样读取超大数据文件 [推广有奖]

  • 0关注
  • 88粉丝

教授

21%

还不是VIP/贵宾

-

威望
1
论坛币
496848 个
通用积分
155.7645
学术水平
94 点
热心指数
106 点
信用等级
82 点
经验
9732 点
帖子
730
精华
7
在线时间
192 小时
注册时间
2005-2-18
最后登录
2023-6-8

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
在电脑内存有限的情况下,有没有办法读取远超过内存大小的数据文件
或者选择性读取其中的一部分,在知道数据结构的情况下

一个例子是,
从美国人口普查网站上下载的1/6样本数据文件是一个dat文件,
用ultraedit查看并不是简单的文本文件,没有办法用ultraedit进行文件分割
网站提供了转换为sas、stata等软件的配套程序(比如do文件),
但是该文件体积超过了4G之多,电脑只有1.5g内存
怎么样读取它,比如第一次读取其中前100万条记录,下次读取下100万条记录,分若干次读完,
因为一次读取经试验怎么也不能完成。
statalist中关于这个问题的讨论,似乎没有给出很好的办法。
一个可行的办法是每次只读取若干个变量,这个在do文件中好修改,
读取前若干条记录,我不知道怎么写,抑或就不能实现?



[此贴子已经被作者于2008-12-29 10:54:03编辑过]

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:STATA高级 Stata 数据文件 tata 大数据 Stata 高级 数据文件

沙发
xge2000 发表于 2011-3-12 13:21:08 |只看作者 |坛友微信交流群
999999999999999999999999999999

使用道具

藤椅
arlionn 在职认证  发表于 2011-3-13 15:13:08 |只看作者 |坛友微信交流群
xge2000 小姐,你这是什么意思?

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-26 15:26