楼主: qinglingnvhai
4234 6

数据集间相减 [推广有奖]

  • 0关注
  • 0粉丝

大专生

98%

还不是VIP/贵宾

-

威望
0
论坛币
13 个
通用积分
0.0001
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
695 点
帖子
41
精华
0
在线时间
55 小时
注册时间
2011-12-19
最后登录
2016-9-3

楼主
qinglingnvhai 发表于 2013-10-28 20:18:51 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
问题如下:有两个数据集有40个相同的变量,数据集A中有1000条记录,数据集B中有一条记录,我现在要做的是用数据集A中的每个记录的每个变量与数据集B中的每个变量相减,产生新的数据集。

由于变量较多,rename 会很麻烦,有没有较好的方法?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据集 rename name 有没有 ENA 记录

沙发
zhou.wen 发表于 2013-10-28 22:10:13
I don't think there is a way that you can skip the rename step to finish you job.
But maybe you can do the rename job skillfully!
https://bbs.pinggu.org/thread-2407075-1-1.html
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
qinglingnvhai + 1 + 1 + 1 热心帮助其他会员

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

Practice Is The Best Teacher!

藤椅
zhou.wen 发表于 2013-10-28 22:11:00
Practice Is The Best Teacher!

板凳
rdwalk 发表于 2013-10-29 06:53:09
data A;
input x y @@;
datalines;
1 2 3 4 5 6 7 8
;
data B;
input x y;
datalines;
10 10
;
proc sql noprint;
  select (compress(('A.'||name||'-'||'B.'||name)) || ' as '||compress(name||name)) into :xxx separated by ', '
  from dictionary.columns
  where libname="WORK" and memname="B";
quit;
%put &=xxx;


proc sql;
  create table C as
    select &xxx
        from A, B;
quit;


因为B小也可两次转置加前缀进行所有变量的重命名。
仅供参考

报纸
yongyitian 发表于 2013-10-29 09:17:35
To avoid renaming a large number of variables,
you can use a temporary array, such as:
  1. data a b;           /* create two example datasets */
  2.   x1=1; x2=1; x3=1; dd=1; a4=1; a5=1; a6=1; output b;
  3.   x1=3; x2=3; x3=3; dd=3; a4=3; a5=3; a6=3;  
  4.    output a; output a; output a;
  5.    output a; output a; output a;
  6. run;

  7. data c;
  8.   array x{7} x1-x3 dd a4-a6 ;   /* array for your data variable */
  9.   array y{7} y1-y7;             /* temporary array hodling data from b */
  10.   retain y1-y7;
  11.   if _n_ = 1 then do;
  12.     set b;
  13.       do i = 1 to dim(x);
  14.       y[i] = x[i];
  15.     end;
  16.   end;
  17.   set a;
  18.    do i = 1 to dim(x);
  19.      x[i]=x[i]-y[i];
  20.    end;
  21.    drop i y1-y7;
  22. run;
复制代码
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
qinglingnvhai + 1 + 1 + 1 观点有启发

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

地板
bjpucl 发表于 2013-10-31 16:30:59
proc iml应该也可以吧。。。

7
赵安豆 发表于 2024-10-11 11:13:17
你可以使用统计软件如SAS、R或Python来实现数据集间相减的操作。下面我将提供在三种语言中如何完成此操作的方法:

### SAS示例代码

```sas
data B;
    set B(in=_b);
    if _b;
run;

data C;
    merge A (rename=(var1=A_var1 var2=A_var2 ... var40=A_var40))
          B (rename=(var1=B_var1 var2=B_var2 ... var40=B_var40));
    by _all_;
   
    new_var1 = A_var1 - B_var1;
    new_var2 = A_var2 - B_var2;
    ...
    new_var40 = A_var40 - B_var40;

    drop A: B:;
run;
```
这个例子中,B数据集被复制创建了一个新的临时数据集。然后使用`merge`语句将两个数据集连接在一起,并通过变量重命名来区分A和B中的变量。最后计算差值并存储在新数据集中。

### R示例代码

```r
library(dplyr)

df_B_replicated <- as.data.frame(replicate(nrow(df_A), df_B))

df_C <- bind_cols(df_A, df_B_replicated) %>%
  mutate_at(vars(-c(id_vars)), ~ .x - get(colnames(df_B)))

colnames(df_C)[-ncol(df_C)] <- colnames(df_A)

df_C
```
在这个R的例子中,首先复制数据集B来匹配A的行数。然后使用`bind_cols`函数将两个数据集合并在一起,并用`mutate_at`函数计算每个变量之间的差值。

### Python 示例代码

```python
import pandas as pd

# 假设 df_A 和 df_B 已经被定义好了
df_C = df_A - df_B.iloc[0]

df_C.columns = df_A.columns # 确保列名正确

# 输出结果或保存到文件
print(df_C)
```
这个Python示例使用Pandas库,直接利用数据框的减法运算符来实现差值计算。由于数据集B只有一条记录,可以简单地选择这条记录与A中的所有记录相减。

以上三种方法都可以在不同编程环境中帮助你完成数据集间相减的任务。根据你的具体需求和使用的软件环境,可以选择合适的方法进行操作。

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-1 00:47