以下内容转自 数析学院,只节选了部分,有需要的同学可以直接查看原文
首先导入 pandas 和 matplotlib 库:
- #导入教程需要的库
- #导入库中的方法:
- ##from (库) import (方法)
- from pandas import DataFrame,read_csv
- #导入库但不导入方法
- ##import (库) as (给库取别名)
- import pandas as pd #使用 pandas 常常取名为 pd
- import matplotlib.pyplot as plt
- import sys #只是为了确定 Python 的版本
- import matplotlib #只是为了确定 Matplotlib 的版本号
- #直接在 notebook 中嵌入绘图结果
- %matplotlib inline
- print('Python version ' + sys.version)
- print('Pandas version ' + pd.__version__)
- print('Matplotlib version ' + matplotlib.__version__)
1、创建数据
数据集由1880年出生5个婴儿名字和对应名字数量组成
- #初始集有婴儿名字及其数目
- names = ['Bob','Jessica','Mary','John','Mel']
- births = [968, 155, 77, 578, 973]
- BabyDataSet = list(zip(names,births))
- BabyDataSet
接下来使用 pandas 库将数据集导出为 csv 文件,首先转换为 dataframe 数据框:
- df = pd.DataFrame(data = BabyDataSet, columns=['Names', 'Births'])
- df
接下来输出 dataframe 到 csv 中,将这个文件命名为birth1880.csv。 说明:to_csv 方法通常用来写入文件,如不另外指定位置,文件将会被保存在 notebook 的当前位置。
- df.to_csv('births1880.csv',index=False,header=False)
以上内容节选自 数析学院,原文内容较多,先搬运到这,后续有时间再补充,有需要的同学可以先直接到 数析学院 查看原文