|
第01天
1.主题:python练习爬虫+python数据分析导引课
python遇见数据采集
https://www.imooc.com/learn/712
慕课网python科学计算
https://www.imooc.com/video/12979
2,摘要
用y = list(x) 或 y = x[ : ]由列表x生成y,则当y改变时,x并不改变;
若直接用y = x生成y,则y变x也变;
numpy的array是python中list的等价物或替代品,可以对整个数组计算;
比较三种方法创建的不同类型:
>>> np2
([1.7, 1.82, 1.74, 1.77], [77.7, 85.2, 66.3, 62.0])
>>> type(np2) #创建元组
<class 'tuple'>
>>> np2 = ([[1.70, 1.82, 1.74, 1.77], [77.7, 85.2, 66.3, 62.0]])
>>> np2 #创建列表
[[1.7, 1.82, 1.74, 1.77], [77.7, 85.2, 66.3, 62.0]]
>>> type(np2)
<class 'list'>
>>> np2 = np.array([[1.70, 1.82, 1.74, 1.77], [77.7, 85.2, 66.3, 62.0]])
>>> np2 #创建数组
array([[ 1.7 , 1.82, 1.74, 1.77],
[ 77.7 , 85.2 , 66.3 , 62. ]])
>>> type(np2)
<class 'numpy.ndarray'>
>>>
了解你的数据Numpy:主要处理二维数组或矩阵
首先import Numpy as np
Numpy 基本统计量——> mean + median + std + corrcoef + sum + sort + …
运算速度比普通python函数更快,因为数组里的数据都有单一的类型。
数据可视化matplotlib:画图
首先import matplotlib.pyplot as plt
plot ——>折线图
scatter ——>散点图
hist ——>直方图
xlabel ——>图形的X轴文字说明
ylabel ——>图形的y轴文字说明
title ——>图形的标题
yticks ——> y轴刻度即单位
fill_between ——>填充颜色
逻辑运算与海量数据处理pandas:针对不同类型混杂的数据集
dataframe == CSV专门存取数据集,用于导入python
首先Import pandas as pd,比如导入bircs.csv
pd.read_csv(‘’, index_col = 0) ——> 导入csv
brics.loc[‘ 行名’] ——> 获取一行信息
brics.[‘ 列名’] ——> 获取一列信息
brics[‘新列名’] ——> 添加新列
brics.loc[‘行名’][‘列名’] ——> 交叉查询
brics.loc[‘行名’, ‘列名’] ——> 交叉查询
brics[‘列名’].[‘行名’] ——> 交叉查询
3.心得感悟
A.简单了解Numpy、Pandas、Matplotlib的基本函数;
B.牢记各种语句定式,便于代码书写;
4.时间统计
昨日阅读5小时,累计250小时
|