- 阅读权限
- 255
- 威望
- 11 级
- 论坛币
- 3591325 个
- 通用积分
- 34055.4093
- 学术水平
- 6834 点
- 热心指数
- 7193 点
- 信用等级
- 6665 点
- 经验
- 1827 点
- 帖子
- 12423
- 精华
- 78
- 在线时间
- 1974 小时
- 注册时间
- 2011-6-13
- 最后登录
- 2025-10-23
已卖:18513份资源
泰斗
还不是VIP/贵宾
TA的文库 其他... 海外原创经济论文和写作技巧
- 威望
- 11 级
- 论坛币
 - 3591325 个
- 通用积分
- 34055.4093
- 学术水平
- 6834 点
- 热心指数
- 7193 点
- 信用等级
- 6665 点
- 经验
- 1827 点
- 帖子
- 12423
- 精华
- 78
- 在线时间
- 1974 小时
- 注册时间
- 2011-6-13
- 最后登录
- 2025-10-23
 | 开心 2025-10-23 05:24:25 |
|---|
签到天数: 2182 天 连续签到: 1 天 [LV.Master]伴坛终老
|
66论坛币
|
楼主最近遇到了一个SAS Proc Transpose 排序变量和数据整合的问题,想请教坛里的高手。 楼主有多个项目需要处理所以不能分心花很多时间解决这个技术问题,所以特此金币悬赏解答。
Sample Data 08-29-2024.xlsx
(15.33 KB)
具体数据请看这个附件。
第一个数据表是成本表格,用完proc transpose 后有些变量的名字里面有单引号比如Category' 4,不知道怎么重新命名这种带单引号的变量回 Category 4。还有如果有的变量的名字超过32个字母SAS 自动缩减proc transpose ID 转换后的变量名字到32个字母。如果我的变量名字里有40个字母的怎么不被缩减到32个字母?
还有一个问题是这个proc transpose 后的ID 里面的变量的值会变成新数据的列,但是列里的category 顺序都打乱了,需要按A-Z 字母表重新排列,就像收入表格的那个数据表里那样。 这个该怎么弄?
收入表格里的数据通过proc transpose 已经弄好了,不需要帮忙处理。
最后需要计算成本和收入比例的表格就是每个人的每个对应的category 的成本除以收入即可得到百分比。 这需要怎么整合收入表格和成本表格才能实现呢? 假设每个人的每个category 都会有收入,但不是每个人的每个category 都有成本。假如一个人任何一个category 都没有成本,那么这个人就不会出现在成本表格里,这就是为什么成本表格里总比收入表格里的人少。
所以这个比例表格要针对以上情况以 收入表格为基准然后做个left join把成本表格里的有成本的人的对应的category 里的成本拿过来做对比。 如果没有成本只有收入的表格那么默认比例为 0 怎么实现? 还有能否帮忙查一下是否有收入表格里的人存在没有收入的category 这个理论上是不可能的。
谢谢。
|
|