数据的获取和清洗
Getting and Cleaning Data
开始时间:2015-02-02 持续时间:4.0周/每周4.0-9.0小时
语言: 英文授课 分类:数学与统计计算机
【课程简介】
学习如何从多渠道获取数据和清洗数据。这是约翰霍普金斯大学数据科学专项系列课程的第三门课。
在处理数据之前,你需要获取数据。本课介绍多种获取数据的基本方法。课程介绍通过网络、APIs、数据库和同事获取不同格式数据的方法。课程还会介绍数据清洗的基础知识以及如何把数据变“整洁”,整洁的数据能大幅提升下游数据分析的速度。课程还将介绍一个完整数据集的组成部分,包括原始数据、处理指令、码书(codebooks)和处理后的数据。课程涵盖收集、清洗和分享数据所需的基础知识。
【课程内容】
学习者需要先完成以下两门课程,或具备相应的知识:
数据师的工具箱(Data Scientist’s Toolbox)
R编程(R Programming)
2、课程形式
课程包含每周的教学视频和小测验,以及期末的同学互评项目。
作为课程的一部分,你需要注册一个GitHub帐号。GitHub是代码协作共享和编辑的工具。在本课以及本系列的其他课程当中,你需要提交你放在GitHub上的公开文件链接,以进行同学互评。
【课程链接】
本帖隐藏的内容
https://www.coursera.org/course/getdata