楼主: O(∩_∩)O~!
2848 5

同一个长字符变量(事务所名称)前后两年值的比较 [推广有奖]

  • 0关注
  • 1粉丝

已卖:8份资源

讲师

18%

还不是VIP/贵宾

-

威望
0
论坛币
3994 个
通用积分
13.4290
学术水平
6 点
热心指数
16 点
信用等级
5 点
经验
8886 点
帖子
276
精华
0
在线时间
333 小时
注册时间
2010-8-5
最后登录
2022-8-16

楼主
O(∩_∩)O~! 发表于 2010-10-21 16:33:04 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
代码 会计截止日 事务所
000002 2005-12-31 毕马威华振会计师事务所
000002 2006-12-31 毕马威华振会计师事务所
000002 2007-12-31 毕马威华振会计师事务所
000002 2008-12-31 毕马威华振会计师事务所
000002 2009-12-31 毕马威华振会计师事务所
000005 2005-12-31 利安达信隆会计师事务所有限责任公司
000005 2006-12-31 利安达信隆会计师事务所
000005 2007-12-31 利安达信隆会计师事务所
000005 2008-12-31 深圳市鹏城会计师事务所有限公司
000005 2009-12-31 深圳鹏城会计师事务所


样本数据如上,现在想判断每一种股票在前后年份之间事务所是否有更改,请教各位如何写程序?事务所的名称不规范,同一个事务所可能有用全名的有用简称的。谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:字符变量 事务所 会计师事务所 有限责任公司 样本数据 变量 事务所 名称 字符

回帖推荐

quruyi0909 发表于4楼  查看完整内容

我的想法是这样的:一般除了‘会计师’‘事务所’ 还有代表地区的字段以外,无论是简称还是全称都包括区别于其他的主要字段,进一步看,全称和简称之间大概有一个规律:就是简称中的所有字段,都包括在全称内(几乎),所以有以下处理办法: 1、用循环语句 按股票代码 转置,将同一种股票不同年份的obv变成var(这部分没写出来,呵呵); 2、用循环语句顺次比较相邻年份间是否相同; 主要用以下程序: data a; input a $6. + ...

本帖被以下文库推荐

沙发
soporaeternus 发表于 2010-10-21 16:48:34
我觉得难点在如何定义两个字符串是一个意义上的“事务所”
我的思路是把字符串中关于事务所,责任公司等意义的子串,和事务所的“名字”分开
只是思路,抛个砖......
已有 1 人评分热心指数 收起 理由
crackman + 1 我很赞同

总评分: 热心指数 + 1   查看全部评分

Let them be hard, but never unjust

藤椅
O(∩_∩)O~! 发表于 2010-10-22 09:01:58
现在的想法是把不同的事务所名称用sas整理出来,然后手工解决全名和简称问题(整理好后有150个不完全同名的事务所),再编码然后判断

不知道有没有更好的办法?

板凳
quruyi0909 发表于 2011-11-7 16:27:22
我的想法是这样的:一般除了‘会计师’‘事务所’ 还有代表地区的字段以外,无论是简称还是全称都包括区别于其他的主要字段,进一步看,全称和简称之间大概有一个规律:就是简称中的所有字段,都包括在全称内(几乎),所以有以下处理办法:
1、用循环语句 按股票代码 转置,将同一种股票不同年份的obv变成var(这部分没写出来,呵呵);
2、用循环语句顺次比较相邻年份间是否相同;
主要用以下程序:
data a;
input a $6. +1 b$18. +1 c$12.;/*读数据*/
%let m=length (b);
%let n = length(c);
%let x= min(&m, &n);
d =&x;/*取最小值的字段长度*/
do t=1 to &m-1 by 2;
   do r =1 to &n-1 by 2;
     if substr(b,t,2)=substr(c,r,2)
           then u+1;/*显示相同字段数*/
        end;
end;
if u*2 =d then o =1; /如果较短变量的字段完全相等于较长字段,则o计数1,表示相邻年份间相等*/
datalines;
利安达 利安达会计师事务所 利安达事务所
;
proc print;
run;

现在就想到这里 呵呵,有不对的地方,别笑话。
已有 1 人评分经验 论坛币 收起 理由
bakoll + 3 + 3 精彩帖子

总评分: 经验 + 3  论坛币 + 3   查看全部评分

报纸
hongxx 发表于 2011-11-8 01:52:04
没办法,中国的金融数据就这德行。
你只能手动在Excel里先处理下同一个中介机构的名称可能涉及 括号的大小写啊,逗号,分隔符啊,空格啊,更为麻烦的是很多中介机构合并或更名,你得google来确定是不是同一个中介机构。通常上市公司关于改聘或续聘中介机构有PDF公告出来的的,偶尔会提及中介机构的更名事项。
如果你处理香港的,更头疼,有很多人名冠名的事务所,涉及“.”,若要求准确,只能手改。是个体力活。

如果用字符串相似度的计算算法来模糊匹配,SAS有相关函数,可以google,但要去掉 会计事务所/律师事务所等关键字。

地板
hubertweir 发表于 2011-11-8 07:04:19
先对事务所变量做频数分析,然后生成一个合理的FORMAT。。。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-29 23:56