matplotlib入门

matplotlib 做基于python的一款可视化神器,类似于 ggplot2,它基本能涵盖常见的一些图形。同时得益于强大的python社区支持,这个包的功能也在不断增加。有时候写多了python,再写R,一时半会还想不起代码咋写。同时python中用于统计的包也比较全面,自己对python了解的还是多一些,准备在数据可视化方面用matplotlib

matplotlib支持一些常见的图形例如:

  • 线图;
  • 散点图;
  • 等高线图;
  • 条形图;
  • 柱状图;
  • 3D 图形,
  • 甚至是图形动画等等.

官网网页
https://matplotlib.org/

学习视频教程: 莫烦的

https://morvanzhou.github.io/tutorials/data-manipulation/plt/1-1-why/

话不多说,先上几张漂亮的图片,压压场

3D

安装

  • 使用pip安装
1
2
python -m pip install -U pip
python -m pip install -U matplotlib
1
2
3
4
#pip install matplotlib --user
#引入matplotlib包
import matplotlib.pyplot as plt
import numpy as np
1
2
fig, ax = plt.subplots()  # Create a figure containing a single axes.
ax.plot([1, 2, 3, 4], [1, 4, 2, 3]) # Plot some data on the axes.
[<matplotlib.lines.Line2D at 0x7f34ca8c95e0>]

U91mJe.png

plt.subplots()函数返回两个对象

  • fig 图形对象
  • ax 坐标轴对象
    当然如果不需要操作坐标轴的话,也可以直接使用plot函数
    1
    2
    plt.plot([2,3,5,6],[2,4,5,6])
    plt.plot([2,3,5,6],[2,4,5,6]) #直接使用plot函数

更加深入的理解图片的构造

figure图片构造

1
2
figure=plt.figure() ##没有坐标轴的空白图片,啥也看不到
fig,ax=plt.subplots() ##带坐标轴的空白图片,只有单个坐标轴

U91uzd.png

1
fig,axs=plt.subplots(2,2) ##2x2的四坐标轴图片

U91nRH.png

Axes对象

  • 通常Axes就是包含data的一个图片
  • 一张figure可以有多个Axes
  • 而一个Axes只属于某一个figure
  • Axes包含有两个或者3个Axis(坐标轴)
  • Axes类似于ggplot分面中的一个分面

对坐标轴中显示数据范围的控制

1
2
axes.Axes.set_xlim() ##控制X轴显示范围
axes.Axes.set_ylim() ##控制y轴显示范围

控制坐标轴标签与图形标签

1
2
3
axes.Axes.set_title() ##图片标签
axes.Axes.set_xlabel() ##x轴标签
axes.Axes.set_ylabel() ##y轴标签

控制图例名称和显示图例

1
2
axes.plot(data,label="图例名")
axes.legend()
1
2
3
4
5
6
7
8
9
10
11
12
13
14
import matplotlib
import matplotlib.pyplot as plt
matplotlib.use('qt5agg')
fig,axs=plt.subplots(2,1) ## 绘制2X1 图片
axs[0].plot([1,2,3,4],[4,5,6,7],label="liner1") #第一张图,以及图例
axs[0].plot([2,4,5,6],[4,5,6,7],label="liner2") #第一张图,以及图例
axs[1].plot([1,6,7,8],[5,6,7,8],label="test") # 第二张图 以及图例
for item in axs: #批量设置标题 和图例
item.set_xlim(0,10)
item.set_xlabel('x label')
item.set_ylabel('y label')
item.set_title('test')
item.legend()
plt.savefig("test.png")

Axis对象

  • 用于设置坐标轴范围
  • 控制坐标轴上显示的标记,Locator对象
  • 控制坐标轴上显示的字符 Formatter对象

Artist

基本上所有的figure都会用到Artist对象,并且Artist是与Axes对象绑定在一起使用的。Artist对象就包含以下几个对象

  • Text
  • Line2D
  • collection
  • Patch

输入数据格式

所有的绘图数据都是基于numpy.array类型进行的,当然有些类似array的数据类型,例如pandas中的dataFrame,numpy中的matrix;这些数据类型作为输入数据时,可能不能够正常的工作,所有还是将它们转换成numpy.array之后再绘制图片吧

  • 将panda 数据框转换

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    import numpy as np
    import pandas
    a=pandas.DataFrame(np.random.rand(4,5), columns = list('abcde')) ##获取4x5的随机数据框
    print(a)
    a b c d e
    0 0.505938 0.742418 0.732312 0.008823 0.559201
    1 0.834437 0.657429 0.136503 0.654495 0.841873
    2 0.725788 0.746307 0.240214 0.732954 0.119796
    3 0.452142 0.172521 0.103506 0.472862 0.744575
    a_array=a.values
    print(a) ##看起来没变化,实质上一个是数据框,一个是数组
    a b c d e
    0 0.505938 0.742418 0.732312 0.008823 0.559201
    1 0.834437 0.657429 0.136503 0.654495 0.841873
    2 0.725788 0.746307 0.240214 0.732954 0.119796
    3 0.452142 0.172521 0.103506 0.472862 0.744575
  • 将numpy.matrix转换

    1
    2
    3
    4
    5
    6
    7
    8
    9
    import numpy as np
    b = np.matrix([[1, 2], [3, 4]])
    print(b)
    [[1 2]
    [3 4]]
    b_asarray = np.asarray(b)
    print(b)
    [[1 2]
    [3 4]]

pyplot两种绘图方式

  • 面向对象的方式

    这种在写脚本的时候,可以封装成函数,在不修改代码的情况下,仅仅改变数据就可以获得不同的图片。用的比较多;不涉及与用户的交互
1
2
3
4
5
import matplotlib.pyplot as plt
x=np.linspace(0, 2, 100)
fig,ax=plt.subplots()
ax.plot(x,x,label='liner')
ax.legend()
  • 直接调用pyplot方法

    这个有点类似ggplot2,在jupyter中用的频繁。不过个人还是比较喜欢用第一种面向对象的方式,毕竟对象嘛..
1
2
3
4
import matplotlib.pyplot as plt
x=np.linspace(0, 2, 100)
plt.plot(x,x,label="liner")
plt.legend()

如何导出图片

文档里用了一个词BacKends,意思就是针对不同的需求,导出不同类型的图片

  • AGG 支持png

  • PS 支持ps、eps

  • PDF 支持pdf

  • SVG 支持svg

  • Cairo 支持png ps pdf svg

配置

一般来说不用配置,能够根据系统自动检测,
linux中配置一下环境变量即可

1
2
3
4
$ export MPLBACKEND=qt5agg
$ python simple_plot.py
##或者
$ MPLBACKEND=qt5agg python simple_plot.py

在脚本内部配置

1
2
3
4
import matplotlib
matplotlib.use('qt5agg')
##导出图片
matplotlib.pyplot.savefig('filename')
------ 本文结束 thankyou 感谢阅读 ------

欢迎扫一扫上面的微信二维码,订阅 codeHub 公众号