楼主: zjying2000
15564 0

[程序分享] matplotlib可视化之如何给图形添加数据标签? [推广有奖]

  • 4关注
  • 15粉丝

学科带头人

40%

还不是VIP/贵宾

-

威望
0
论坛币
5462 个
通用积分
589.8635
学术水平
34 点
热心指数
43 点
信用等级
29 点
经验
52566 点
帖子
883
精华
0
在线时间
3393 小时
注册时间
2010-10-5
最后登录
2024-4-30

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
欢迎关注,知乎专栏:爬虫与数据分析:https://zhuanlan.zhihu.com/zjying2000
当我们获取完数据之后,一般来说数据可视化呈现的最基础图形就是:柱状图、水平条形图、折线图等等,在python的matplotlib库中分别可用bar、barh、plot函数来构建它们,再使用xticks与yticks(设置坐标轴刻度)、xlabel与ylabel(设置坐标轴标签)、title(标题)、legend(图例)、xlim与ylim(设置坐标轴数据范围)、grid(设置网格线)等命令来装饰图形,让它更明晰与美观,但是对于数据标签(即在图形中的每一个点或条形位置上标注出相应数值),却没有直接的命令导出。我们看很多python可视化做出的柱状图等等,在柱子数量不多的条件下,没有数据标签,只有光秃秃的一个个柱子,这样就使得图形缺了些什么。

事实上,在python的matplotlib中有在图形中添加文字说明的命令——text,我们就可以利用这个命令,在图中每个单位要素中添加相应文字,来构造数字标签。

以本人专栏知乎专栏写的《大数据时代,哪些课程最受欢迎?》所爬取数据为例,经过numpy得到了不同课程类别下的平均学习人数,如图:


该数据是dataframe格式的数据架构(名为ppv3),建立柱状图来展示该数据,步骤与代码如下:

  1. plt.figure(figsize=(10,6))

  2. #设置x轴柱子的个数

  3. x=np.arange(14)+1 #课程品类数量已知为14,也可以用len(ppv3.index)

  4. #设置y轴的数值,需将numbers列的数据先转化为数列,再转化为矩阵格式

  5. y=np.array(list(ppv3['numbers']))

  6. xticks1=list(ppv3.index) #构造不同课程类目的数列

  7. #画出柱状图

  8. plt.bar(x,y,width = 0.35,align='center',color = 'c',alpha=0.8)

  9. #设置x轴的刻度,将构建的xticks代入,同时由于课程类目文字较多,在一块会比较拥挤和重叠,因此设置字体和对齐方式

  10. plt.xticks(x,xticks1,size='small',rotation=30)

  11. #x、y轴标签与图形标题

  12. plt.xlabel('课程主题类别')

  13. plt.ylabel('number')

  14. plt.title('不同课程类别的平均学习人数')

  15. #设置数字标签

  16. for a,b in zip(x,y):

  17. plt.text(a, b+0.05, '%.0f' % b, ha='center', va= 'bottom',fontsize=7)
  18. #设置y轴的范围
  19. plt.ylim(0,3700)
  20. plt.show()
复制代码

最终得到的图形为:

着重讲一下如何设置数字标签

  1. for a,b in zip(x,y):
  2.     plt.text(a, b+0.05, '%.0f' % b, ha='center', va= 'bottom',fontsize=7)
复制代码

首先,前边设置的x、y值其实就代表了不同柱子在图形中的位置(坐标),通过for循环找到每一个x、y值的相应坐标——a、b,再使用plt.text在对应位置添文字说明来生成相应的数字标签,而for循环也保证了每一个柱子都有标签。

其中,a, b+0.05表示在每一柱子对应x值、y值上方0.05处标注文字说明, '%.0f' % b,代表标注的文字,即每个柱子对应的y值, ha='center', va= 'bottom'代表horizontalalignment(水平对齐)、verticalalignment(垂直对齐)的方式,fontsize则是文字大小。

条形图、折线图也是如此设置,饼图则在pie命令中有数据标签的对应参数。对于累积柱状图、双轴柱状图则需要用两个for循环,同时通过a与b的不同加减来设置数据标签位置,比如在本文另一文章《双十一预售战下的电商风云》,如图:

其命令为:

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Matplotlib matplot plot TLI Mat 标签 如何

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-30 23:54