楼主: alex1206
2428 7

求问:如何处理这些凌乱的原始数据 [推广有奖]

  • 10关注
  • 0粉丝

已卖:3份资源

讲师

99%

还不是VIP/贵宾

-

威望
0
论坛币
444 个
通用积分
1.8170
学术水平
1 点
热心指数
3 点
信用等级
2 点
经验
33915 点
帖子
579
精华
0
在线时间
753 小时
注册时间
2010-9-1
最后登录
2019-3-10

楼主
alex1206 发表于 2015-11-10 12:58:58 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
最近在处理一份比较棘手的原始数据,数据类型如下:
Variable

Length

UPC14
RVDESC40
AGGLONG140
AGGLONG240
AGGLONG340
AGGLONG440
AGGLONG540
DEPARTMENT1
VOLCON6.4
UNIT_MEASURE8


数据格式和内容如下(仅截取一部分):
10000280102|        +PRV * ASST CPCK PSCLM      12OZ|CATEGORY - BAKERY SNACKS                | CUPCAKES/BROWNIES                      |  PRIVATE LABEL                         |   PRIVATE LABEL                        |    PRIVATE LABEL                       |1|0.7500|POUNDS  |
   10000282445|        +PRV * CHOC BRNI PCR         6OZ|CATEGORY - BAKERY SNACKS                | CUPCAKES/BROWNIES                      |  PRIVATE LABEL                         |   PRIVATE LABEL                        |    PRIVATE LABEL                       |1|0.3750|POUNDS  |
   10004300835|        +PRV * JLY SKC PW INDVL    2.7OZ|CATEGORY - BAKERY SNACKS                | CUPCAKES/BROWNIES                      |  PRIVATE LABEL                         |   PRIVATE LABEL                        |    PRIVATE LABEL                       |1|0.1688|POUNDS  |
   10243008379|        +LTDEB PLN SKC PCR           2OZ|CATEGORY - BAKERY SNACKS                | CUPCAKES/BROWNIES                      |  MCKEE FOODS CORPORATION               |   MCKEE FOODS CORPORATION              |    LITTLE DEBBIE                       |1|0.1250|POUNDS  |
   10720300097|        +ENTMN REG PNDCK PW       2.75OZ|CATEGORY - BAKERY SNACKS                | CUPCAKES/BROWNIES                      |  GRUPO BIMBO                           |   BIMBO BAKERIES USA INC               |    ENTENMANNS                          |1|0.1719|POUNDS  |
   11011300101|        +JMAIC REG CPCK TPLBG       10OZ|CATEGORY - BAKERY SNACKS                | CUPCAKES/BROWNIES                      |  J. M. CRUZ INC                        |   J. M. CRUZ INC                       |    JAMAICA                             |1|0.6250|POUNDS  |
   11011300175|        +JMAIC REG MNTCD PW MINI    12OZ|CATEGORY - BAKERY SNACKS                | CUPCAKES/BROWNIES                      |  J. M. CRUZ INC                        |   J. M. CRUZ INC                       |    JAMAICA                             |1|0.7500|POUNDS  |
   11034899999|        +BRDGH CRMB CPCK PCR        14OZ|CATEGORY - BAKERY SNACKS                | CUPCAKES/BROWNIES                      |  BATTERS & DOUGHS INC                  |   BATTERS & DOUGHS INC                 |    BATTERS & DOUGHS                    |1|0.8750|POUNDS  |
   11037436117|        +TFTTB CHOC CKRLL PCR      3.6OZ|CATEGORY - BAKERY SNACKS                | CUPCAKES/BROWNIES                      |  THE FATHERS TABLE                     |   THE FATHERS TABLE                    |    THE FATHERS TABLE                   |1|0.2250|POUNDS  |
   11037436118|        +TFTTB RDVLT CKRLL PCR     3.6OZ|CATEGORY - BAKERY SNACKS                | CUPCAKES/BROWNIES                      |  THE FATHERS TABLE                     |   THE FATHERS TABLE                    |    THE FATHERS TABLE                   |1|0.2250|POUNDS  |
   11099500125|        +FREEB PLN CPCK PCR MINI    10OZ|CATEGORY - BAKERY SNACKS                | CUPCAKES/BROWNIES                      |  GEORGE WESTON LTD                     |   MAPLEHURST BAKERIES LLC              |    FREEDS BAKERY                       |1|0.6250|POUNDS  |


想请问坛子里的大牛:怎么写sas的语句才能去掉Rvdesc前的“+”和Agglong1,Agglong2,Agglong3, Agglong4, Agglong5前后的“|”,得到规范的表格呀?多谢多谢啊!
Def.txt (3 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:原始数据 CORPORATION Department Category BAKERIES 如何

回帖推荐

yongyitian 发表于7楼  查看完整内容

兼爱,务实,低调,心怡,效率

沙发
nolonger123 发表于 2015-11-10 13:09:05 来自手机

藤椅
孤单的我们 发表于 2015-11-10 13:09:57
替换掉可以吗 Tranwrd(variable,text1,text2)

板凳
goodmangis 发表于 2015-11-10 13:18:22
写个程序处理不就可以了吗?

报纸
alex1206 发表于 2015-11-10 23:57:31
孤单的我们 发表于 2015-11-10 13:09
替换掉可以吗 Tranwrd(variable,text1,text2)
好的好的,我试一下,谢谢啊

地板
alex1206 发表于 2015-11-10 23:59:04
goodmangis 发表于 2015-11-10 13:18
写个程序处理不就可以了吗?
我刚学没多久,用dlm去掉了一些,但是不能全部去掉。能不能告诉一下,你要怎么做

7
yongyitian 发表于 2015-11-11 10:36:20
  1. /* use compress() function to remove "+" */

  2. data have;
  3.    infile "C:\temp\Def.txt" lrecl=279;
  4.    input ;
  5.      UPC   = kscan(_infile_, 1, "|");
  6. RVDESC           = kscan(_infile_, 2, "|");
  7. AGGLONG1   = kscan(_infile_, 3, "|");
  8. AGGLONG2   = kscan(_infile_, 4, "|");
  9. AGGLONG3   = kscan(_infile_, 5, "|");
  10. AGGLONG4   = kscan(_infile_, 6, "|");
  11. AGGLONG5   = kscan(_infile_, 7, "|");
  12. DEPARTMENT = kscan(_infile_, 8, "|");
  13. VOLCON     = kscan(_infile_, 9, "|");
  14. UNIT_MEASURE = kscan(_infile_, 10, "|");
  15. run;
复制代码

MP756A.JPG (114.65 KB)

MP756A.JPG

已有 1 人评分学术水平 热心指数 信用等级 收起 理由
Tigflanker + 4 + 3 + 2 观点有启发

总评分: 学术水平 + 4  热心指数 + 3  信用等级 + 2   查看全部评分

8
alex1206 发表于 2015-12-9 06:36:04
yongyitian 发表于 2015-11-11 10:36
好的,感谢感谢!!因为之前已经搞定了,所以一直没上来回复

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-6 08:18