楼主: JMPer
1726 0

[学习分享] 利用JMP公式,生成新计算的变量 [推广有奖]

  • 1关注
  • 31粉丝

合作版主

教授

86%

还不是VIP/贵宾

-

威望
0
论坛币
18143 个
通用积分
5.4451
学术水平
92 点
热心指数
91 点
信用等级
86 点
经验
40716 点
帖子
698
精华
4
在线时间
806 小时
注册时间
2014-7-24
最后登录
2023-7-14

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

数据整理及分析中经常遇到需要根据现有变量生成新变量的情况,比如将连续型的年龄划分为年龄段,将BMI的具体值转换为“标准”、“超重”等分组,提取地址变量中的某个字段,提取时间变量中的年月日等等。在常用的一些编程统计分析软件中,我们需要记住一些函数才能够实现。而在JMP中,这些需求都可以通过清晰直观的“公式编辑器”点击操作实现,某些甚至可以一键生成。今天这篇文章我们将介绍几个平时分析中最常用的情境,帮助大家直观感受JMP生成新变量的方便与快捷。


如何利用 “公式编辑器”生成新变量?

示例数据选取JMP自带样本数据库中的Diabetes数据,如图1。

图1 JMP样本库自带示例数据Diabetes 另存为.png

1JMP样本库自带示例数据Diabetes



1.1插入新变量

假设我们要根据BMI产生分类变量。


首先,创建一个新变量用来指示分组。这里有两种方式,第一种是在任何一个变量顶部变量名处单击右键弹出菜单选择插入列,如图2;第二种是在空列处双击左键,如图3。

插入新变量后,我们可以在该列名处单击右键进行列信息的设置,包括变量名称及类型等(关于变量名称的转换,可点击这里回顾)。这里我们将该变量命名为[BMI分组],变量类型设置为名义变量。

图2 插入新变量(方式1).png

2 插入新变量(方式1

图3 插入新变量(方式2).png

3插入新变量(方式2



1.2 编辑公式

假设将BMI分为三组:正常为<25,超重为25-<30,肥胖为>=30,我们需要利用条件公式,也就是常说的if-then创建新变量。那么在JMP中如何实现呢?

首先,我们在BMI分组变量名处右键菜单中选择【公式…】,即弹出针对该变量的公式编辑对话框,如图4所示。

图4 公式编辑器界面.png


4公式编辑器界面


通过JMP中的条件和比较两部分语句,我们可以生成BMI的分组变量,具体操作步骤如图5和图6。注意:双箭头后面的0、 1、 2是我们给分类的命名,分类名称不局限于数字,我们还可以给分类命名为“正常”、“超重”、“肥胖”。

图5 条件语句操作步骤(1).png 5条件语句操作步骤(1

图6 条件语句操作步骤(2).png


6 条件语句操作步骤(2


公式编辑完毕之后,点击应用,确定,即可生成BMI分组变量,如图7所示。

图7 生成BMI分组变量.png


7生成BMI分组变量



如何利用“新建公式列”快速生成新变量?


可能有的朋友觉得这样编辑公式也很麻烦,希望有更简便的操作,确实是有的,JMP将一些常用的公式集合成了快捷选项,可以通过在变量名处单击鼠标右键触发,达到一键生成新变量的目的,但需要注意的是,不是所有的公式都有,比如上面讲到的按照一定条件分组的操作,还是必须将条件公式输入进去才能生成满足需求的新变量。


那么这个快捷选项怎么操作呢?我们这里举两个例子,示例数据是2019年我国部分城市空气气象数据,见图8。

图8 示例数据.png

图8示例数据



2.1 一键提取日期变量中的月份等信息

在date变量名处单击右键,然后如图9所示依次选择新建公式列→日期时间→月,点击后,即生成月份列,并自动命名为【月】,如图10所示。

图9 一键提取日期中的月份(1).png


图9一键提取日期中的月份(1)

图10 一键提取日期中的月份(2).png

10一键提取日期中的月份(2


从图9中,我们还可以看到,步骤3中,除了可以选择月,还可以选择年、季度、周、星期等,可以一键提取出我们想要的日期信息,在我们进行时间序列相关的分析时,你会发现这些快捷选项非常实用。感兴趣的话可以每一个功能都实际操作一下看看效果。


2.2 一键实现变量变换

新建公式列选项中除了日期相关的提取,更多的是关于连续型变量的变量变换,如图11中,我们可以直接在新列中对选取列进行四舍五入、平方、对数变换、指数变换等操作。

图11 一键实现变量变换(1).png


11一键实现变量变换(1


还有针对多列的计算,比如新建公式列→合并→求和,可以得到多个列的加和值,如图12,其他的选项感兴趣的朋友们也可以一一尝试下。

图12 一键实现变量变换(2).gif

12一键实现变量变换(2


此外,我们甚至可能一键进行更复杂的变换,如图13所示,我们可以针对目标列进行一键中心化、标准化、显示秩次,甚至Box-Cox变换,当然这些操作都需要建立在一个清晰的分析目的基础上。

图13 一键实现变量变换(3).png


13一键实现变量变换(3


今天的文章我们分享了如何根据现有变量生成满足分析需要的新变量,展示了JMP中方便又快捷的“公式编辑器”和“新建公式列”的强大功能,希望可以帮助大家在数据清洗的过程中事半功倍。但需要强调下的是,这里只是列举了几个比较常用的情况,还有非常多且同样实用的但本文没有具体介绍的公式和选项,希望大家使用一些样本数据多进行尝试和练习,体会无需编程也能快速便捷实现数据转换的目的。如果你也想体验JMP生成新变量的小技巧,欢迎下载JMP 30天免费试用


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:JMP Diabetes 统计分析软件 公式编辑器 公式编辑

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-26 19:14