数据分析中让数据可视化展示的10种方法

之前也写过画可视化的方法的文章,用的是 pyecharts 库:Python让你的数据生成可视化图形。但是总觉得还不够,很多可视化图没用上,今天我们换一个库来绘制可视化图。

我们这次主要用到两个库来画图,Matplotlib 库和 seaborn 库。

我们先要安装这两个库,分别用 pip 命令安装即可。

安装好后就可以导入了,取一个名称短一点的别名。

直方图

直方图是一种二维统计图表,用图形表示数据的分布情况。

Matplotlib 画直方图:

Seaborn 画直方图,当参数 kde=False 时,和 上面 Matplotlib 画的直方图基本一样。

当 kde 参数默认不填或者设置当参数 kde=True 时,在上图基础上,会显示核密度估计,这可以帮助我们估计概率密度。

条形图

条形图是用宽度相同的条形的高度或长短来表示数据多少的图形。

Matplotlib 画条形图:

Seaborn 画条形图:

通过效果图可以看出,Seaborn 生成的条形图默认颜色不一样,视觉效果更好些。

折线图

折线图可以显示随时间而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势。

用 Matplotlib 库画折线图:

用 seaborn 库画折线:

我们发现,画折线图,这两个库的效果几乎一样,只是 seaborn 库画的图标注了 x 和 y 坐标的位置。

散点图

散点图是指在回归分析中,数据点在直角坐标系平面上的分布图,散点图表示因变量随自变量而变化的大致趋势,据此可以选择合适的函数对数据点进行拟合。

用 Matplotlib 库画散点图:

用 seaborn 库画散点图:

两个方法画的图差不多,区别在于 Matplotlib 库画的图默认是长方形,seaborn 库画图默认是正方形,不仅画出了散点图,还给出了他们的分布情况。

箱线图

箱线图,是一种用作显示一组数据分散情况资料的统计图。

Matplotlib 绘制箱线图:

Seaborn 绘制箱线图:

饼图

饼图常用于统计学模块,用于显示各块的比例。

Matplotlib 画饼图:

热力图

热力图是以特殊高亮的形式显示访客热衷的页面区域和访客所在的地理区域的图示。

数据用 seaborn 中自带的 flights 航班数据,记录了 1949 年到 1960 年期间的每个月航班乘客的数量。

颜色越浅表示乘客越多。

雷达图

玩过绝地求生游戏的伙伴应该会很熟悉这种图,游戏结束后会出现一张评价雷达图。

看到这个图,生存值为 100,我们就知道了,肯定是大吉大利的「吃鸡」了,下面我们用 Matplotlib 库画出来。

成对关系

我们用 Seaborn 自带的 iris 数据集,什么是 Iris 数据集呢?这里引用下百度百科的解释:Iris 数据集是常用的分类实验数据集,由 Fisher, 1936 收集整理。Iris 也称鸢尾花卉数据集,是一类多重变量分析的数据集。数据集包含 150 个数据集,分为 3 类,每类 50 个数据,每个数据包含 4 个属性。可通过花萼长度,花萼宽度,花瓣长度,花瓣宽度4个属性预测鸢尾花卉属于(Setosa,Versicolour,Virginica)三个种类中的哪一类。

Python 数据可视化方法就介绍到这里了,如果你有更好的方法,欢迎给我留言。

 

文章为pk哥原创,我在我的公众号: Python 知识圈 上会分享更多心得体会,你也可以关注。

***版权申明:本文为 Python知识圈 pyzhishiquan.com 原创,没有Python知识圈书面授权,请勿以任何形式转载,摘编,复制或镜像。***

为您推荐

发表评论

电子邮件地址不会被公开。