楼主: dataminingr
3622 5

[程序分享] 从头学习R和python数据分析(长期更新) [推广有奖]

  • 0关注
  • 4粉丝

等待验证会员

小学生

64%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
1 点
热心指数
1 点
信用等级
0 点
经验
58 点
帖子
7
精华
0
在线时间
9 小时
注册时间
2015-6-14
最后登录
2015-8-14

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
从今天起这个系列开始写了,想通过这个系列帮助大家学习熟练数据分析和数据挖掘,俗话说工欲善其事必先利其器,这个教程选择的工具是R和python,尽管两门语言的用户一直在撕逼,我们这里就不详细比较二者的优劣势了,免得被人扔砖头。搁置争议,真的猛士会把两个都搞定,如果论主次的话我们以R为主兼论python。
但是希望大家在这里学到与众不同的东西,跟着走下去保证能学会
前面要学会语言的基本操作,为什么用R,除了免费以外,因为它有大量的包可以下载安装,先学会包的安装,加载。   

#加载包
  1. if (!suppressWarnings(require("ggplot2"))) {
  2.   install.packages("ggplot2")
  3.   require("ggplot2")
  4. }

  5. if (!suppressWarnings(require("reshape2"))) {
  6.   install.packages("reshape2")
  7.   require("reshape2")
  8. }
复制代码


上面的代码共加载了两个包ggplot2和reshape2,前者是实现平面图表最好的工具,后者是数据整形数据清理的法宝,后者是为前者服务,他们的作者都是Hadley Wickham,他们家可是统计世家,父亲和姐姐都是统计学博士,最近他被推举为引起R软件革命的人,现在的facebook,google等巨鳄都在用他开发的包,但是我个人认为形容他的成就用一句话就够了:“他让成千上万人的工作变得更加简单”。

通常安装包都会使用`install.packages("reshape2")`语句,简简单单干净利落,还有一种批量安装包的方法就是将别人的R安装目录下的library文件夹整个拷贝到你的R下面,覆盖你的library文件夹,这样他的大多数包你基本都可以加载了,但是一些需要依赖环境的包除外。
另外就是加载包,加载包有两种方式`library()`和`require("")`,记得前面不带引号。比如只要执行`library(ggplot2)`就加载了ggplot2包。

上面的语句我们一共完成了四项项任务:加载、判断、安装、加载,suppressWarnings函数是捕捉并跳过报错的,如果加载`require("reshape2")`,reshape2没有安装,就会报错,报错就被suppressWarnings捕捉到,返回一个FALSE值,而“!”是个逻辑值函数,表示非的意思,这样如果报错,if语句就会判断非非为真,就会执行大括号里的模块,安装reshape2,然后加载。加载以后你就可以使用包里的函数了
“!”这个符号有用!!!
if语句在R中的结构是这样的:
  1. if () {
  2.   
  3. }
  4. #或者
  5. if() {
  6.   
  7. } else {
  8.   
  9. }
复制代码

这里需要谨记的一点是else一定要和if的大括号在一行,当然你也可以写if的嵌套形式,只要符合这个就行了。
需要说明的是R语言应用包的安装和python是不同的,R包安装和调取都在R里面进行,python模块是在系统环境安装,然后再在python里加载的。python模块安装除了将模块下载到本地然后用python执行脚本安装以外,比较简单的安装是使用easy_install模块安装,但是需要在系统环境安装,比如在win7下,打开CMD,然后在下面执行:
  1. easy_install pandas
复制代码

这样就安装了pandas这个模块,如果报和Microsoft Visual C++ 9.0相关的错误,你需要去下面的地址下载安装以来环境Microsoft Visual C++ 9.0
  1. http://www.microsoft.com/en-us/download/details.aspx?id=44266
复制代码


然后在python里调取模块
  1. import pandas as pd
复制代码

这个pd是pandas一个缩写,比较像SQL里的表名称缩写,作用也比较相似,方便后面的代码使用。

到这里我们学习了R怎么安装包,怎么加载包,判断语句,非逻辑值和一个跳过错误函数,python怎么安装模块和加载模块。
我们的口号是写有挑战的代码。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Python数据分析 python 数据分析 Microsoft warnings python 数据挖掘

沙发
dataminingr 发表于 2015-8-13 15:00:48 |只看作者 |坛友微信交流群
可以关注我们的公众号,很多关于R和python的书籍、数据、文章、代码。
关于我们,关注理性与文艺,用数据创作内容性的精致阅读,这里是数据分析挖掘人员与文艺青年的集结地,不做鼓吹,只踏踏实实的做一个又一个数据驱动的文章,用数据解读生活现象,实实在在的数据挖掘、分析、可视化,并分享十分清晰的思路和代码注释,并设计机器人减轻数据分析的负担,无论你感兴趣还是想参与都可以关注,请加微信公众号大音如霜
qrcode_for_gh_89f96c48034b_430.jpg

已有 1 人评分学术水平 热心指数 收起 理由
ryoeng + 1 + 1 对论坛有贡献

总评分: 学术水平 + 1  热心指数 + 1   查看全部评分

使用道具

藤椅
jjxm20060807 发表于 2015-8-13 21:20:57 |只看作者 |坛友微信交流群
感谢楼主分享

使用道具

板凳
海的方向 发表于 2015-8-21 09:12:03 |只看作者 |坛友微信交流群
顶一下这个公众号

使用道具

报纸
xiaoheige75 发表于 2016-8-1 15:28:46 |只看作者 |坛友微信交流群
强力顶一下这个公众号, 多谢共享, 干货满满

使用道具

地板
Maxrou77 发表于 2016-8-2 12:01:03 |只看作者 |坛友微信交流群
关注公众号,感谢分享

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-28 18:09