楼主: zhy6364
4471 13

[原创博文] sas截取数据,真心求助大牛 [推广有奖]

  • 0关注
  • 0粉丝

大专生

70%

还不是VIP/贵宾

-

威望
0
论坛币
2403 个
通用积分
0
学术水平
0 点
热心指数
3 点
信用等级
0 点
经验
408 点
帖子
50
精华
0
在线时间
71 小时
注册时间
2009-6-1
最后登录
2019-4-27

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
Security No.Participants
1Servicer: 1st Financial Bank  USA,Indenture Trustee: Bank of New York Mellon (The)
2Indenture Trustee: Bank of New  York Mellon (The),Servicer: 1st Financial Bank USA
3Originator: 321 Henderson  Receivables Origination LLC,Seller: 321 Henderson Receivables Acquisition  LLC,Master Servicer: J.G. Wentworth Management Co. Inc.,Underwriter: Deutsche  Bank Securities Inc.,Indenture Trustee: Wilmington Trust Company ,Bond Counsel:  Sidley & Austin
4Seller: 321 Henderson  Receivables Acquisition LLC,Originator: 321 Henderson Receivables Origination  LLC,Owner Trustee: Deutsche Bank Trust Company Americas,Master Servicer: J.G.  Wentworth Management Co. Inc.,Underwriter: Deutsche Bank Securities Inc.,Indenture  Trustee: Wilmington Trust Company ,Bond Counsel: Sidley & Austin
5Underwriter: Citigroup Global Markets Inc.,Bond Counsel: Foley & Lardner,Servicer: Access Group Inc,Underwriter: UBS Financial Services, Inc.,Trustee: Deutsche Bank Trust Company Americas,Underwriter: KeyBanc Capital Markets,Indenture Trustee: Deutsche Bank Trust Company Americas,Servicer: Kentucky Hgr Ed Std Ln Corp,Originator: Access Group Inc


有上万个这样的证券及相关参与方的数据,现在我想要新建一系列column,把诸如originator,underwriter,indenture trustee这样数据的分门别类地列出来。还有一点麻烦的是有时一个类别的参与方不止一个,例如No.5证券中underwriter有三个,还不是连着的。求助大牛应该怎么处理呢?

有几个想法:1.substr和find一起用,把“originator:”“,”的位置挑出来,截取其中的内容,但怎么样使找到的逗号是“originator:“之后第一个出现的逗号呢?而且这之后同一格中要再有一个underwriter该怎么办。。。
2.按逗号把Participants中的内容全部打断,放到不同column中(不知能否实现),然后再循环在每个row中分别依次找originator,underwriter,indenture trustee,这样每个待检索的cell中只会有一个逗号。

求大牛指点迷津,不胜感激~~~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Participants receivables origination Acquisition Receivable

回帖推荐

ntsean 发表于9楼  查看完整内容

试试我这个办法 data a; length paticipants $1000; length str $200; paticipants='Underwriter: Citigroup Global Markets Inc.,Bond Counsel: Foley & Lardner,Servicer: Access Group Inc,Underwriter: UBS Financial Services, Inc.,Trustee: Deutsche Bank Trust Company Americas,Underwriter: KeyBanc Capital Markets,Indenture Trustee: Deutsche Bank Trust Company Americas,Servicer: Kentucky Hgr Ed Std Ln C ...

本帖被以下文库推荐

沙发
liulinjun010 发表于 2012-5-10 14:23:08 |只看作者 |坛友微信交流群
真是需要大牛才能解决的问题

使用道具

藤椅
zhy6364 发表于 2012-5-10 14:25:06 |只看作者 |坛友微信交流群
liulinjun010 发表于 2012-5-10 14:23
真是需要大牛才能解决的问题
多谢来顶!

使用道具

板凳
hcydlee 发表于 2012-5-11 10:46:19 |只看作者 |坛友微信交流群
第二个思路可以用scan(source,n,dlm)函数实现, source是原始字符串,n 是第几个组分,dlm是分隔符。
80 字节以内
不支持自定义 Discuz! 代码

使用道具

报纸
hcydlee 发表于 2012-5-11 10:47:53 |只看作者 |坛友微信交流群
做一个do while 循环,把扫描出来的word赋值给临时字符串变量temp do while (temp ne "")
80 字节以内
不支持自定义 Discuz! 代码

使用道具

地板
zhy6364 发表于 2012-5-13 22:41:53 |只看作者 |坛友微信交流群
hcydlee 发表于 2012-5-11 10:47
做一个do while 循环,把扫描出来的word赋值给临时字符串变量temp do while (temp ne "")
多谢你的回答!
大牛,你帮我看看下面的

data Security1;
set Security;
if index(Participants,'Originator')>0 then do;
temp=substr(Participants, find(Participants,'Originator:')+12);
Originator=substr(temp,1,find(temp,',')-1);
do while (index(temp,'Originator:')>0);
temp=substr(temp,find(temp,'Originator:')+12);
Originator=Originator||','||substr(temp,1,find(temp,',')-1);
end;
end;
else Originator='';
drop temp;
run;

这个跑出来Originator栏里只有每个security的第一个Originator,后面还有其他的originator的都没有截到,桑心了... code哪里有问题了捏?

使用道具

7
hcydlee 发表于 2012-5-14 09:13:47 |只看作者 |坛友微信交流群
zhy6364 发表于 2012-5-13 22:41
多谢你的回答!
大牛,你帮我看看下面的
呵呵,我也是SAS学习中,称不上大牛,大家互相学习。为什么不用“Orginator”做分隔符去截取呢?
80 字节以内
不支持自定义 Discuz! 代码

使用道具

8
zhy6364 发表于 2012-5-14 11:08:06 |只看作者 |坛友微信交流群
hcydlee 发表于 2012-5-14 09:13
呵呵,我也是SAS学习中,称不上大牛,大家互相学习。为什么不用“Orginator”做分隔符去截取呢?
这个貌似不行,分隔符规定了只有;,:一类的几种,我原来试过把‘Originator:’当分隔符,行不通呃...

使用道具

9
ntsean 发表于 2012-5-14 12:27:47 |只看作者 |坛友微信交流群
试试我这个办法

data a;
length paticipants $1000;
length str $200;
paticipants='Underwriter: Citigroup Global Markets Inc.,Bond Counsel: Foley & Lardner,Servicer: Access Group Inc,Underwriter: UBS Financial Services, Inc.,Trustee: Deutsche Bank Trust Company Americas,Underwriter: KeyBanc Capital Markets,Indenture Trustee: Deutsche Bank Trust Company Americas,Servicer: Kentucky Hgr Ed Std Ln Corp,Originator: Access Group Inc';
i=1;
str=scan(paticipants,1,',');
do while (str ne '');;
   type=scan(str,1,':');
   orgnization=scan(str,2,':');
   output;
   i=i+1;
   str=scan(paticipants,i,',');
end;
drop i str;
run;

这里假设分隔每个单位的分隔符是逗号,我看了下你的字符,大部分是这样的,唯一一个例外就是有的 'inc'前也有个逗号,但是这个可以先用我的办法处理好之后,单独进行处理, 比如碰到这样情况就合并到前面的
已有 1 人评分经验 论坛币 收起 理由
bakoll + 3 + 3 精彩帖子

总评分: 经验 + 3  论坛币 + 3   查看全部评分

使用道具

10
hcydlee 发表于 2012-5-14 14:08:08 |只看作者 |坛友微信交流群
你这些字符串都是怎么读进SAS的?
80 字节以内
不支持自定义 Discuz! 代码

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-30 18:44