楼主: 清明风雨
8494 7

[问答] 怎么根据性别把一列变量分为两列 [推广有奖]

  • 0关注
  • 0粉丝

硕士生

44%

还不是VIP/贵宾

-

威望
0
论坛币
222 个
通用积分
3.5500
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
23494 点
帖子
23
精华
0
在线时间
303 小时
注册时间
2013-12-10
最后登录
2023-11-12

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
数据是spss自带的Employee data。salary默认是男女两个性别的数据在一列里,现在我想根据gender把salary分为两列数据,一列为男性的薪水,一列为女性的薪水,除了把gender排序后手动分离出两列数据外,有其他方法吗?

Employee data.rar (8.64 KB) 本附件包括:
  • Employee data.sav

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Employee Gender salary SPSS Ploy 女性 男女

沙发
BearDream 发表于 2016-6-14 06:32:08 |只看作者 |坛友微信交流群
if (gender="m") salary.m=salary.
if (gender="f") salary.f=salary.
exe.

上面貼去 syntax 跑一下就會產生 salary.m 跟 salary.f 兩欄了
然後每一欄都會有一堆 system missing values
這樣是你要的樣子嗎?
我看了一下你的資料  不是配對樣本  所以  上面那樣做之後依舊還是 474 筆資料
我是想不出還為啥你會需要這樣啦 :p
通常是配對樣本  譬如說夫妻  才要把他們的資料放在同一列
不過  你應該是你有你的想法跟需要啦

ps. 我不相信手動  儘管只是 copy and paste 也還是會有 human error 的可能 XD

已有 2 人评分经验 论坛币 热心指数 收起 理由
xiaowenzi22 + 20 热心帮助其他会员
admin_kefu + 25 + 2 热心帮助其他会员

总评分: 经验 + 20  论坛币 + 25  热心指数 + 2   查看全部评分

使用道具

藤椅
清明风雨 发表于 2016-6-14 09:36:31 |只看作者 |坛友微信交流群
BearDream 发表于 2016-6-14 06:32
if (gender="m") salary.m=salary.
if (gender="f") salary.f=salary.
exe.
下面这是我根据gender手动把salary分为男、女两列数据,male和female变量名也是手动输入的,但是在处理很多数据时会比较麻烦,我想问下spss有没有点几下菜单选择gender和salary两个变量点击确定后就可以自动生成male和female数据的功能?
2016-06-14_103038.png

使用道具

板凳
BearDream 发表于 2016-6-14 11:21:46 |只看作者 |坛友微信交流群
可是  spss 一列是一個觀測值  
通常會這樣並排放  同一列的 male 跟 female 得是同一組  譬如說  來自同一個婚姻或是男女關係
您的資料男女數目並不同  所以很明顯不是 paired sample您確定還是要這樣放嗎?

另外  您這樣放的問題在於  那個變項 male 下面那欄數字  其實是 salary  不是變項 male 的值
所以  比較合理的變項名應該是 salary.m 跟 salary.f  

ps. 您那欄 male 其實是 female 的 salary  
然後 female 那欄是 male 的 salary  要小心喔!
所以我說  手動就會有 human error 的空間  

使用道具

报纸
BearDream 发表于 2016-6-14 11:28:28 |只看作者 |坛友微信交流群
spss data 下面 有一個 reconstruct 指令是可以 click click 就將 data 重組
但是  您的 data 中沒有一個變項可以「定義」哪一個男生跟哪一個女生要放在同一列  
(也就是我講的  同一組)
所以  沒辦法用那個 reconstruct 來重新排資料

您真的要排成您顯示的那樣
得要將 male/female 的 salary 另外寫出去成新的資料檔
然後  再將新的資料兩用 add variable 的方式合併
聽起來  好像比 copy-and-paste 費工  
可是  這會是我建議的方式  因為我基本上不建議手動資料

使用道具

地板
清明风雨 发表于 2016-6-14 20:37:18 |只看作者 |坛友微信交流群
BearDream 发表于 2016-6-14 11:21
可是  spss 一列是一個觀測值  
通常會這樣並排放  同一列的 male 跟 female 得是同一組  譬如說  來自同一 ...
非常感谢讨论!
嗯,命名上我确实没写清楚,应该要写salary.m 跟 salary.f。我的上个回复忘说了,男女工资比较是要用independent samples test,不能用于paired samples test的,这个数据是用来比较男女职员的工资,他们互相是独立的,不属于配对样本。
我一直想把salary根据男女性别分开是想做下相关分析,看男女工资是否是独立的可以用于independent samples test,是因为我在看paired samples test资料的时候看到它的结果里需要分析两个样本是否有相关关系来确定样本是否适用于paired samples test,所以就想试下independent samples test的数据是否真的也是互相独立的。
我手动做的数据把male那一栏粘贴成female的工资是因为我事先把gender那一列的m、f重新编码为1、0了,等我开始复制粘贴salar时却记不清习惯上1是代表男性还是女性了,所以把male那一列弄错了

使用道具

7
BearDream 发表于 2016-6-15 15:54:30 |只看作者 |坛友微信交流群
清明风雨 发表于 2016-6-14 20:37
非常感谢讨论!
嗯,命名上我确实没写清楚,应该要写salary.m 跟 salary.f。我的上个回复忘说了,男女工 ...
"paired samples test资料的时候看到它的结果里需要分析两个样本是否有相关关系来确定样本是否适用于paired samples test"...
---> 這倒不一定

paired sample t test 跟 correlation 沒有絕對關係

譬如說  有六組配對資料  說  夫妻好了
六個丈夫的分數是 1 2 3 4 5 6  他們太太的分數分別是 6 5 4 3 2 1
這一組資料是完全負相關 (r = -1)  但是  這個 paired sample t test 的 t 值會是 0

另一種情況
六個丈夫的分數是 3 3 3 4 4 4   他們太太的分數分別是 5 6 7 4 6 8
這個相關會是 0  但是 paired sample test 會顯著

您那樣重排資料的問題在於  為什麼 21450 要跟 57000 配對(第一組)
為什麼不可以是 21450 跟 40200 配?
他們沒有關係啊  
不若 丈夫A 一定得要跟 太太 A 配對
而事實上  你把第二列的前兩個數值 57000 跟 40200 互換位置  整個相關係數就會不一樣

是不是 pair 還是 independent sample 要看實驗設計  不是看相關係數的顯著性

回到統計問題的本質
correlation 看的是兩組分數是不是共變
t test 看的是  這兩組分數有沒有差異

^﹍^

使用道具

8
gaorenda 发表于 2018-5-23 11:55:22 |只看作者 |坛友微信交流群
在stata中,怎么根据性别,将职业变量变成男性职业变量和女性职业变量呢?命令是什么?谢谢回答

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-26 21:08