大家讲到SAS的制图问题。我也想说一说自己的意见和建议。个人以为和ODS的良好结合,使得SAS制图美观许多。尤其SAS9.2之后,图形质量大有改进。Gplot之类的老派图形的确比较难看一些。自从有了SG-的过程,我从来再没有用过G-类的图形过程。我想,GPLOT之所以许多人还在用,在某种程度上是惯性使然(应该会被淘汰掉)。
毫无疑问,EXCEL出图的确很美观,适合做slides等等。或许受制于我自身对excel的理解水平,excel也有所短。我大概比较一下:
- 统计上的较为特殊的图
许多sas里常规的图式在excel里是偏门甚至不提供。许多的统计图形包含计算变量,比如生物统计里生存曲线里的生存率,risk集合等等。我可以说很多人写不出其中的算式,因为它不是简单的加减。如果软件不提供这种算法,就没有理由用它做。毕竟,SAS是统计软件,统计绘图理应是它内嵌而又擅长的东西。 - 图形是否得体合适
我个人以为,从发表科研文章的角度来看,excel的图就不应该(或慎重)放到文章里去。Excel擅长的BARCHART, PIE CHART, 等等,就是占空间不小,信息量不大的东西,一两句话就说的清楚,为什么要占半篇的空间? - Excel未必容易
对于那些对excel不熟悉的人来说,excel的图形也挺难做。你也需要把数据颠来倒去的,去迎合它的做图要求。另外,最令人反感的是,有时候还得手动输入。 - 绘图背后的知识
比如,SMOOTHED曲线是常用的非参数数据表现方法。我估计excel肯定也有类似的功能。但是,值得注意的是,这些看起来形似的曲线或许在背后有不同的算法。如果对excel不熟悉,你也未必知道它的算法,因此你没有理由去用它。 - R的图
Excel的图和sas在设计理念上差距较大,更靠近的是R的制图。我非常喜欢R图形里方便的排版,比如排列十个小图。有时候做simulation需要这样的效果。在sas里的确有些尴尬。另外据说R因为初始设计时对图形架构的前瞻性极其后来的开拓性扩充,使其具备一定的先进性和更大的灵活性。 - 效率和管理问题
如果你主要使用sas,把所有的工作在sas里完成,应该更加高效一些。如果只是因为一张图,把数据输出到excel里,r里,然后做图,往往事倍功半。因为你也要想到将来的修改问题,数据和文件的维护问题等等。 - Sas制图未必难
Sas属于傻瓜软件,没有不会的,只有不熟的。许多看似复杂的东西其实并不十分复杂。比如PROC TEMPLATE定制绘图模板(GTL语言)。如果从白纸开始写的确有些难度。但是如果在一定的基础上(初始模板)修改就简单的多了。而且sas也给你提供这种方便。
总而言之,做图的原则是图形要具备准确性,常规性和易读性。意思是说,不要盲目做图,不要做怪图,不要做太复杂的图。图形本身不说话,要靠读者的理解。弄得太复杂太不寻常,就失去它应有的意义。我个人的经验是,图在统计文章里有一定的必要性,而且应该具备一定的“统计”性。只是为了表示一个比例或者数字,放一个大条或者大饼什么的在文章里,不值得。
值得说明的是,我的经验基本上建立在个体使用者的角度之上。如果在一个较大的已然形成SAS成形管理的环境里,情形或许不完全相同。比如模板式绘图,抛弃用GPLOT也已建立的模板显然是不明智的.
京剧
更多的话:
感谢大家的支持。对于这么多的反馈,深表感激;对于这么夸张的赞扬,受之有愧。从中也可以看得出,作为SAS的使用者,大家对此软件还是有所期待和关注的,尤其是对于众说纷纭,其中不乏微词的SAS绘图功能。
我在以前的工作中,和许多医学院和公共卫生专业的学生合作过项目。我知道他们绘图有的用PRISM, 有的用EXCEL,有的用SPSS,有的用STATA,有的用R(虽然很少),以及其他的不知名的绘图软件。而我自己,因为出身工科,甚至用过CAD来会绘制非常复杂的统计图例。我发现,这些图有时候和我用SAS绘出的图并不完全相同。包括表面的,也包括内容。如果说,各有长短,应该是比较客观的。我也发现,他们有的对图形的阐释和我想的也不完全一样。比如一个大家常犯的问题是,根据图纸距离来描述实际差距。另外,我们也看到有的人故意利用视觉来影响读者的判断。比如拉长坐标轴来表现较大的差异;压缩尺度,来模糊其中的不同。
这些问题或许不是如何来用软件画图,而是如何正确表达的问题。这一点其实是最重要的。客观而简洁的图示应该是我们追求的较高的目标,也许不必要斤斤计较一条线的粗细长短。
大家也说混用多个软件的好处。可是有两点值得考虑:1.掌握和维持某种软件绘图技巧的软性成本;2.软件自身的实体开销。如果说一个公司SAS和MATLAB使用权并存,我想成本支出一定不菲。因此我以为这一点说是容易,其实不易。
京剧