楼主: 邱宗满
1411 8

[学科前沿] 如何让没接触过R的人也能无障碍使用R进行部分统计分析? [推广有奖]

实习版主

院士

33%

还不是VIP/贵宾

-

威望
1
论坛币
131852 个
通用积分
87.1783
学术水平
301 点
热心指数
322 点
信用等级
302 点
经验
22634 点
帖子
517
精华
0
在线时间
6129 小时
注册时间
2019-10-2
最后登录
2023-7-5

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

谈及数据分析工具就不得不谈到R,R作为开源软件,有许多统计学家和职业学者为其开发了丰富的工具包,其中也包含了一些最时髦的统计方法。但是,许多人对R望而生却,觉得R是靠代码进行数据分析,“难度很大”。

R有这么难吗?假如我们不是要进行R工具包开发,我们需要学向量、矩阵运算吗?为什么有好些R培训上来就是高数?普通使用者需要吗?有没有更简单的方法让没接触过R的人也可能无障碍且正确的使用R进行一部分统计分析?

我和很多人都讨论过这些问题,个人觉得,对于普通使用者而言,R可以很简单。培训方是完全可以降低个体的学习成本和使用成本的,但他们从来不这么干。为什么?

为了说明这件事,我开发了一个用于MVN包(用于多元正态性检验的R包)的Excel工具,该工具可在同名公众号左下角的菜单中进入下载。(工具的制作并不难,核心是Excel的数据验证功能以及IF函数)

打开这个Excel工具后,顶部有使用说明。

                              

1.png

接着,我们进入操作区。操作区的黄色部分为必选项,而蓝色部分则是可选项。如果只想进行多元正态性检验,蓝色部分可以不进行更改。此处,我们选择数据集Q2,并使用hz方法进行多元正态性检验。

2.png

完成操作后,在最下方的语法区将显示对应的R语法。我们只需将“最终语法”内容复制到R中即可(即粉色区域)。

3.png

此处,我使用RStudio进行演示。

4.png

运行后,软件输出结果

5.png

这个工具并不是将写好的语法进行整理,对应R包中所拥有的功能和所包含的选择已经全部整理完毕,使用者只需像使用对话框软件那样在下拉菜单中进行选择即可。

6.png

换言之,R包的语法被制作成了拥有对话框的窗口,可类比SPSS。

7.png

我个人觉得,这是令SPSS看了沉默、Stata看了流泪的思路,因为这完全打破了使用代码的软件和使用对话框的软件之间的界限。

以SPSS为例,这可以理解为使用者在SPSS中进行所有设定后,点击下方的“粘贴”按钮

8.png

从而生成代码进行分析

9.png

估计连SAS看了都会直呼不可战胜。

假如你没有这种感觉,那可能因为你已经度过了学习R最痛苦的那段时间,并不是站在“初学者”/“新手”的立场上考虑这个问题。

换位思考一下,如果对应的每个R包都有这样类似的工具,或者对于每个特定的分析都整理了这样的Excel(可以包含多个R包),那么完全没有R基础的人不是也可以使用R进行分析并且不会出现错误么?使用成本不是大大减少?而且无需反复查看R手册,甚至减少了一部分英语不好的使用者的学习成本。

当然,有部分人可能会反驳说,在R的使用过程中,写出相应功能函数,会有提示帮助,所以这个Excel没有用

10.png

那么,对于这部分人,我觉得他们说的很有道理。但是,他们只基于自身考虑,而且往往是电脑操作水平比较高、学习能力比较强或者已经有一定R使用经验的人。我希望他们可以更多的从0基础人员的角度进行考虑,而不是使用“这么简单,这你都学不会”的借口将人与人之间的差异拉大。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:统计分析 计分析 多元正态性检验 RStudio 数据分析工具

已销号
沙发
邱宗满 学生认证  发表于 2020-12-5 14:00:37 |只看作者 |坛友微信交流群
Excel辅助工具之多元正态性检验R包“ MVN”.xlsx (43.5 KB) 一楼说的Excel工具
已销号

使用道具

藤椅
llb_321 在职认证  发表于 2020-12-5 22:39:27 |只看作者 |坛友微信交流群
11000个包,楼主都准备弄出来吗
R是非常个性化的,无论适用场景,还是具体解决方案,楼主这样搞,R就不是R了

使用道具

板凳
llb_321 在职认证  发表于 2020-12-5 22:43:32 |只看作者 |坛友微信交流群
再说了,R也没有多难,用的好需要基本的统计训练、应用专业基础和具体的R实现摸索,搞个傻瓜式的R不是没人想过尝试过,但都是吃力不讨好的事。

使用道具

报纸
张敏3 发表于 2020-12-6 10:40:38 来自手机 |只看作者 |坛友微信交流群
邱宗满 发表于 2020-12-4 23:30
谈及数据分析工具就不得不谈到R,R作为开源软件,有许多统计学家和职业学者为其开发了丰富的工具包,其中也 ...
这样搞工作量也很大的,有这点时间说不定R也学会了吧

使用道具

地板
邱宗满 学生认证  发表于 2020-12-6 18:40:51 |只看作者 |坛友微信交流群
llb_321 发表于 2020-12-5 22:39
11000个包,楼主都准备弄出来吗
R是非常个性化的,无论适用场景,还是具体解决方案,楼主这样搞,R就不是R ...
11000个包,不可能都用吧,一个学科内,一般人,就用到几个?
后一句话说的是实话,吃力不讨好,主要是花功夫了,不能从中获利的问题。
至于基本的统计训练,这个东西和软件无关,每个软件的使用都需要统计训练。
做这个只是说明一个问题,对于某个软件,在软件操作上的成本和学习成本可以降得很低,但没人做,难道重点不是这个?
已销号

使用道具

7
邱宗满 学生认证  发表于 2020-12-6 18:44:51 |只看作者 |坛友微信交流群
张敏3 发表于 2020-12-6 10:40
这样搞工作量也很大的,有这点时间说不定R也学会了吧
首先,做这个工作量可不大哦。就很简单的Excel语法,写过的都知道。反正所有统计都要培训统计基础,培训完,大家都一样。接着,就到了学习具体软件的时候了,这个时候,不同软件的学习成本和操作成本就出来了。

每个学科常用的包就那么几个,如果有人在本学科做一下,对新手在软件操作上的成本和学习成本就可以降得很低,不是吗?

至于老手,他已经熟练了,有基础了,也可以依靠自学,很快上手其它包。



已销号

使用道具

8
llb_321 在职认证  发表于 2020-12-7 06:09:45 |只看作者 |坛友微信交流群
您知道为啥会有一万多个包吗?再算算,您觉得这些包有多少个函数?这些函数有多少种差异化的参数,多少种使用方法?努力吧

使用道具

9
邱宗满 学生认证  发表于 2020-12-8 00:10:26 |只看作者 |坛友微信交流群
llb_321 发表于 2020-12-7 06:09
您知道为啥会有一万多个包吗?再算算,您觉得这些包有多少个函数?这些函数有多少种差异化的参数,多少种使 ...
可你一个人就用一万多个包吗?不至于吧?
另外,这个工具就是为了让新手更容易上手,而不是针对老手的,老手还需要这个东西干嘛?那证明不是老手。

你的发言完全没有换位思考的表现,只是为了抱怨“一个人为一万多个包开发工具”的困难,可问题在于压根不需要这么多呀,也不需要你来做呀?这是给培训方的建议,是对那些收了钱要培训新手,却又完全不考虑新手特点的的培训方的指责。

再说了,新手一过来,只需要基础的十几二十个包配个完整的,就能让他上手不是吗?

你前面说的“R也没有多难”,一看就是没有和完全的新手交流过的,你可能不晓得全中国硕博中有多少人会觉得R难,我也不晓得,但我平常与人交流时,感觉挺多的。或者你身处好大学,压根就不需要和普通人交流了对吧?反正周边都是天才或者富有代码经验的人。

另外,你前面早就强调了“用的好需要基本的统计训练、应用专业基础和具体的R实现摸索”,而对于新手来说,几个这样简单的工具,马上就能让他们看到整个包所有的默认设定,这反而是好事不是吗?多少人用R,用了多久,默认设定有什么都不知道?这一点不难察觉到吧?多少本科生、研究生和博士生被导师逼着用R,就学了几个瘸腿的R包?

如果不够了解现状,就站在已经学成的那批人的位子上,就来发表评论的话,我觉得挺简单的。
已销号

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-29 01:19