搜索
人大经济论坛 附件下载

附件下载

所在主题:
文件名:  Original Data.xls
资料下载链接地址: https://bbs.pinggu.org/a-1718086.html
附件大小:
原始数据originaldata



期望结果expectedresult


楼主试验用Excel 里的array 来解决以下问题, 但是实施起来特别麻烦,因为要paste array 公式好几十次。 比如说这是北美的邮政编码数据。我想要从中筛选Texas州的部分城市的所有邮政编码zipcode。但是我只要部分城市的所有邮政编码的数据。这些邮政编码要单独列出像这个筛选后的表格一样。我把texas州的所有zipcodes单独列到一个原始数据的tab里叫zipcodes。因为我不会用那个原始数据里的zipcodes,因为那个不一定全面,就把这个单独的zipcodestab当做是全面的Texaszipcode表格吧,为了显示不同,我只是把原有的texas的所有zipcodes都加了一,然后另存到一个tab里,为了看sas筛选后的效果。

现在需要把这些数据分别在sas里建立原始数据 。比如original_data.sas(这个太大只建立就好,不用打开,最好能用sql建立),我已经在Excel里筛选到texas州的数据了,为了以后更新方便,还是去掉筛选,把所有的原始数据输入到SAS里,然后用where语句提取texas或者是任何一个州的相关数据,要变量城市primarycity,看原始数据C列,县county,看原始数据G列,注意不能用 A列的zip,而是用另一个单独的zipcodetab里的zip codes 数据(这个是规定使用的zip code 资源,所以要单独放到一个sas 数据里,然后再用data step加到输入到sas 里的原始数据中。那个州的变量是state看原始数据F列,texas的代号是TX。

提取texas的数据后,要从所有城市里提取所需要的部分城市的数据。这个恐怕paste不容易因为每个城市都要单独在SAS里加引号。我当初是把所有城市先弄个pivottable然后再把部分需要的城市paste到旁边,在Excel里筛选的zipcodes。但是太耗时间了。

SAS产生的结果我也要它列成这个附件里的格式sas里用proccontents应该可以解决名字问题,所以在输入数据到sas时可以把H列以前的pivottable和city列都删除。从H列开始是所需的部分城市。把它们每个城市所对应的所有zipcodes从原始数据里找出来,并帖到城市所在名的下边排成一列一列的。这H-J列的zipcodes只是个例子不是筛选出来的,所以用SASarrary用原始数据里先筛选出部分所需城市,然后再从另一个单独的zipcodetab里筛选出所对应的每个所需城市的所有zipcodes。

先把上边的问题解决,下边的能解决更好。金币不是问题。解答最详细的且能正确操作产生所需结果的版友将获得最终奖励。

我还要county这个可以在Excel里实现,但是要能一块用sas做了最好。举个例子。以下三个县county是从德州的原始数据里提取的。现在我要把每个county里面所有的城市和每个城。市的zipcodes都找出来也和上边城市列zipcodes的格式一样,把每个county的所有zipcodes做成一列一列的。



Dallas County
Denton County
Collin County


SAS要能把county筛选成下边这个形式就足够好了,我可以在Excel里进行近一步有针对性的筛眩

Dallas County

city1

73256

city2

73156

city3

73542

city3

75251

city1

72291

city2

72952

city2

724928


注解:

这个资料里所用的邮政编码和我所用的另一个资源(特别大)里的邮政编码是不同的,所以我才另外建立了一个tab叫zipcode把Texas的所有zipcode作为一个例子放在这个tab里。为了和原始数据里的zipcode区分我就把这个tab里的zipcode都在原始zipcode的基础上加了一。你在原始数据的Excel里的第二个tab 里一查就可以看出来。

我想看的是SASarray筛选过程,现在把数据上传到原帖中了。

要不然在Excel里一个个筛选在排成我在expectedresultH列以后的那种格式太麻烦了。比如让你做几百次。所以用SASarray应该可以产生一个整个的outputtable就像我描述的expectresult一样。

我只是用sas做部分分析,剩下的要在excel里做。如果能直接提取我早就弄了,但是我用的zipcode是另一个资源里的特别大,和帖子里的原始数据类似,但略有不同。

但我要的结果是只能拿原始数据里的城市,去搜集另一个数据里的zipcodes然后划分到每个所需的城市里。因为另一个资源里的城市数据出错了,但是zipcodes是对的。但我只能用另一个资源里的zipcodes,这是规则。听起来很麻烦,所以要求大神帮忙。



    熟悉论坛请点击新手指南
下载说明
1、论坛支持迅雷和网际快车等p2p多线程软件下载,请在上面选择下载通道单击右健下载即可。
2、论坛会定期自动批量更新下载地址,所以请不要浪费时间盗链论坛资源,盗链地址会很快失效。
3、本站为非盈利性质的学术交流网站,鼓励和保护原创作品,拒绝未经版权人许可的上传行为。本站如接到版权人发出的合格侵权通知,将积极的采取必要措施;同时,本站也将在技术手段和能力范围内,履行版权保护的注意义务。
(如有侵权,欢迎举报)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

GMT+8, 2025-12-24 22:54