或者选择性读取其中的一部分,在知道数据结构的情况下
一个例子是,
从美国人口普查网站上下载的1/6样本数据文件是一个dat文件,
用ultraedit查看并不是简单的文本文件,没有办法用ultraedit进行文件分割
网站提供了转换为sas、stata等软件的配套程序(比如do文件),
但是该文件体积超过了4G之多,电脑只有1.5g内存
怎么样读取它,比如第一次读取其中前100万条记录,下次读取下100万条记录,分若干次读完,
因为一次读取经试验怎么也不能完成。
statalist中关于这个问题的讨论,似乎没有给出很好的办法。
一个可行的办法是每次只读取若干个变量,这个在do文件中好修改,
读取前若干条记录,我不知道怎么写,抑或就不能实现?
[此贴子已经被作者于2008-12-29 10:54:03编辑过]