楼主: 小鳄鱼a
2485 6

求问去掉特定字符以及补充缺失值 [推广有奖]

  • 6关注
  • 10粉丝

已卖:280份资源

学科带头人

3%

还不是VIP/贵宾

-

威望
0
论坛币
125 个
通用积分
0.0040
学术水平
40 点
热心指数
45 点
信用等级
43 点
经验
32801 点
帖子
1185
精华
0
在线时间
1539 小时
注册时间
2009-7-16
最后登录
2018-10-5

楼主
小鳄鱼a 发表于 2014-8-28 23:26:48 |AI写论文
20论坛币
先说一下,支付的论坛币肯定是要大于20的
1、如图,我想去掉“会计师事务所”以及它后面的字符。
2、缺失值的填充原则是,对于每个stkcd的dcost,比如000002,那么按照year2006与2009两点确定一个等差数列,来分别填充这个序列前面2005,这个序列里面的07,08,以及这个序列后面的10。如果一个stkcd只找到一个有dcost值得,那么把这个stkcd的所有年份的dcost都填充成一样的。  如果一个sktcd 在2005到2013的区间里,只有06 ,09 ,12的dcost有观测,那么相当于构造两个等差数列,05到09的是一个,而09到13的是一个。
   谢谢各位

QQ截图20140828230812.jpg (301.66 KB)

QQ截图20140828230812.jpg

关键词:缺失值 会计师事务所 stkcd Cost 等差数列 慢性病 而且 影响

沙发
小鳄鱼a 发表于 2014-8-28 23:27:23
谢谢谢

藤椅
cnwz 发表于 2014-8-29 06:57:13
1.可以试试  substr(DADTUNIT,1,index(DADTUNIT,'会计师事务所')-1)
2.不明白
已有 1 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
小鳄鱼a + 5 + 1 + 1 + 1 精彩帖子

总评分: 论坛币 + 5  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

板凳
小鳄鱼a 发表于 2014-8-29 07:33:26
2,可以理解为2点确立一条线,如果有三个点,肯定是有两条线。其实我说的太繁琐,但是又不知道怎么简单的表达

报纸
小鳄鱼a 发表于 2014-8-29 16:34:43
cnwz 发表于 2014-8-29 06:57
1.可以试试  substr(DADTUNIT,1,index(DADTUNIT,'会计师事务所')-1)
2.不明白
谢谢,第2个的意思是如下,按照1996与1998测算,1995应该为1.5,1997应该是2.5,等差是0.5。按照1998与1999算,2000的dcost应该是7,等差是2。
stkcd dcost year
1 . 1995
1 2 1996
1 . 1997
1 3 1998
1 5 1999
1 . 2000

地板
cnwz 发表于 2014-8-30 10:11:53
这个2有点复杂,抱歉,帮不了
已有 1 人评分论坛币 收起 理由
小鳄鱼a + 5 精彩帖子

总评分: 论坛币 + 5   查看全部评分

7
小鳄鱼a 发表于 2014-8-30 10:39:27
cnwz 发表于 2014-8-30 10:11
这个2有点复杂,抱歉,帮不了
或者按照每个stkcd,把dcost缺省的按照这个stkcd中dcost不缺省的平均值填充,可以吗

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-10 21:23