楼主: sophiafinn
2502 9

[原创博文] 怎么把这样的文本导到SAS里成数据库表格啊? [推广有奖]

  • 1关注
  • 4粉丝

硕士生

33%

还不是VIP/贵宾

-

威望
0
论坛币
1419 个
通用积分
126.7221
学术水平
39 点
热心指数
39 点
信用等级
27 点
经验
394 点
帖子
185
精华
0
在线时间
63 小时
注册时间
2009-7-7
最后登录
2019-7-7

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
我从另外一个软件里导出大量这样的数据想转化成数据库在sas里处理,应该怎么做啊?
这是其中一个例子,我的一个txt文档中有大量这样的在这里。见附件

Serial Number: 78721336
Word Mark: AAAA
International Class: 039
U.S. Class: 100 105
Goods and Services: Airplane chartering; Air transportation; Rental of airplanes; Transportation of passengers and/or goods by private jet; DATE OF FIRST USE: 2005.05.10; DATE OF FIRST USE IN COMMERCE: 2005.05.10
Mark Drawing Code: (3) DESIGN PLUS WORDS, LETTERS, AND/OR NUMBERS
Design Search Code: 01.07.02; 01.07.25; 26.01.08
Filing Date: 20050927
Pseudo Mark: ARISE AIR
Owner Name: (APPLICANT) Arise Air, Inc.
Owner Address: Suite 11 42 Tremont Street Duxbury MASSACHUSETTS 02332 CORPORATION                                           Corporation MASSACHUSETTS
Type of Mark: SERVICE MARK
Register: PRINCIPAL
Live / Dead: PENDING
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据库表 数据库 CORPORATION Transportat Internation airplanes private 数据库 软件

sample.txt

5.73 KB

回帖推荐

elek.me 发表于6楼  查看完整内容

你试试。

本帖被以下文库推荐

沙发
elek.me 发表于 2010-12-23 15:53:13 |只看作者 |坛友微信交流群
假定你的数据就是多个你贴出来的数据的集合,可以用下面的方法:
  1. data have;
  2.         length varname $ 30;
  3.         varname=cats("var_",ifn(mod(_n_,14)=0,14,mod(_n_,14)));
  4.         obs=ceil(_n_/14);
  5.         infile cards truncover;
  6.         input @": " char $200.;
  7. cards4;
  8. Serial Number: 78721336
  9. Word Mark: AAAA
  10. International Class: 039
  11. U.S. Class: 100 105
  12. Goods and Services: Airplane chartering; Air transportation; Rental of airplanes; Transportation of passengers and/or goods by private jet; DATE OF FIRST USE: 2005.05.10; DATE OF FIRST USE IN COMMERCE: 2005.05.10
  13. Mark Drawing Code: (3) DESIGN PLUS WORDS, LETTERS, AND/OR NUMBERS
  14. Design Search Code: 01.07.02; 01.07.25; 26.01.08
  15. Filing Date: 20050927
  16. Pseudo Mark: ARISE AIR
  17. Owner Name: (APPLICANT) Arise Air, Inc.
  18. Owner Address: Suite 11 42 Tremont Street Duxbury MASSACHUSETTS 02332 CORPORATION                                           Corporation MASSACHUSETTS
  19. Type of Mark: SERVICE MARK
  20. Register: PRINCIPAL
  21. Live / Dead: PENDING
  22. Serial Number: 78721336
  23. Word Mark: AAAA
  24. International Class: 039
  25. U.S. Class: 100 105
  26. Goods and Services: Airplane chartering; Air transportation; Rental of airplanes; Transportation of passengers and/or goods by private jet; DATE OF FIRST USE: 2005.05.10; DATE OF FIRST USE IN COMMERCE: 2005.05.10
  27. Mark Drawing Code: (3) DESIGN PLUS WORDS, LETTERS, AND/OR NUMBERS
  28. Design Search Code: 01.07.02; 01.07.25; 26.01.08
  29. Filing Date: 20050927
  30. Pseudo Mark: ARISE AIR
  31. Owner Name: (APPLICANT) Arise Air, Inc.
  32. Owner Address: Suite 11 42 Tremont Street Duxbury MASSACHUSETTS 02332 CORPORATION                                           Corporation MASSACHUSETTS
  33. Type of Mark: SERVICE MARK
  34. Register: PRINCIPAL
  35. Live / Dead: PENDING
  36. ;;;;

  37. proc transpose data=have out=want(drop=_name_);
  38.         by obs;
  39.         var char;
  40.         id varname;
  41. run;
复制代码
我的博客: http://elek.me/sas
联系我: http://about.me/elek

使用道具

藤椅
elek.me 发表于 2010-12-23 15:54:08 |只看作者 |坛友微信交流群
不过前提是你的数据格式要统一;至于label和变量名的话,你可以自己定义。
我的博客: http://elek.me/sas
联系我: http://about.me/elek

使用道具

板凳
sophiafinn 发表于 2010-12-23 17:17:07 |只看作者 |坛友微信交流群
elek.me 发表于 2010-12-23 15:54
不过前提是你的数据格式要统一;至于label和变量名的话,你可以自己定义。
谢谢! 但是数据格式基本一样 但不完全一样 比如第二个数据多了这个变量,少了那个变量,其他都和第一个一样,请见我原帖附件。
但是这些数据中我只需要两个变量: Filing Date: 和 Owner Name:
只需要把这2个挑出来做成表格就可以了,请问怎么实现呢?

使用道具

报纸
elek.me 发表于 2010-12-23 17:20:18 |只看作者 |坛友微信交流群
这样的话,就简单的多了。
等下哦。
我的博客: http://elek.me/sas
联系我: http://about.me/elek

使用道具

地板
elek.me 发表于 2010-12-23 17:35:43 |只看作者 |坛友微信交流群
你试试。
  1. data have;
  2.         infile "d:\sas\AAAA.txt" pad;
  3.         input @"Filing Date: " filing_date yymmdd8. @"Owner Name: " owner_name $200.;
  4.         format filing_date yymmddn.;
  5.         label filing_date="Filing Date"
  6.                   owner_name="Owner Name";
  7. run;
复制代码
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
hopewell + 1 + 1 + 1 说的很好哦

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

我的博客: http://elek.me/sas
联系我: http://about.me/elek

使用道具

7
sophiafinn 发表于 2010-12-23 17:55:49 |只看作者 |坛友微信交流群
多谢! 导出来了,我还有个1.5G的 txt 文档,一会导导 看看,谢谢啊!

使用道具

8
elek.me 发表于 2010-12-23 18:45:36 |只看作者 |坛友微信交流群
如果owner name没那么长的话,可以把长度设短一点,可能会节省点运行时间。
我的博客: http://elek.me/sas
联系我: http://about.me/elek

使用道具

9
sophiafinn 发表于 2010-12-23 20:40:57 |只看作者 |坛友微信交流群
8# elek.me

我试了 因为txt 文档有1.25G所以用txt本身打不开,用SAS run的时候 提示这个 ,然后结果文件 中有0个observation,没结果
是不是因为txt打不开的文件(因为太大),sas也run不出来啊?

1853  data have;
1854  infile "d:\sas\A.txt" pad;
1855   input @"Filing Date: " filing_date yymmdd8. @"Owner Name:
1856  " owner_name $200.;
1857  format filing_date yymmddn.;
1858  label filing_date="Filing Date"
1859  owner_name="Owner Name";
1860  run;

NOTE: The infile "d:\sas\A.txt" is:
      Filename=d:\sas\A.txt,
      RECFM=V,LRECL=256,File Size (bytes)=1343891243,
      Last Modified=22Dec2010:11:54:58,
      Create Time=23Dec2010:14:04:46

NOTE: 36440382 records were read from the infile "d:\sas\A.txt".
      The minimum record length was 1.
      The maximum record length was 256.
      One or more lines were truncated.
NOTE: SAS went to a new line when INPUT @'CHARACTER_STRING' scanned past the end of a line.
NOTE: The data set WORK.HAVE has 0 observations and 2 variables.
NOTE: DATA statement used (Total process time):
      real time           35.40 seconds
      cpu time            34.82 seconds

使用道具

10
elek.me 发表于 2010-12-23 21:00:43 |只看作者 |坛友微信交流群
加你gtalk了。 你最好先用UltraEdit之类的编辑器,先查看一下文本内容,确认下结构是对的。
我的博客: http://elek.me/sas
联系我: http://about.me/elek

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-21 06:38