0

0

使用 Matplotlib 和 Seaborn 进行数据可视化

betcha

betcha

发布时间:2025-09-03 14:37:01

|

188人浏览过

|

来源于php中文网

原创

Matplotlib 提供精细控制,Seaborn 简化统计绘图,两者结合可高效实现数据可视化:先用 Seaborn 快速探索数据,再用 Matplotlib 调整细节与布局,实现美观与功能的统一。

使用 matplotlib 和 seaborn 进行数据可视化

在使用 Python 进行数据可视化时,Matplotlib 和 Seaborn 无疑是两把利器。它们能将那些躺在表格里的冰冷数据,转化成直观、富有洞察力的图表,帮助我们理解趋势、发现异常、甚至讲述一个完整的故事。简单来说,Matplotlib 是一个功能强大、灵活度极高的底层绘图库,让你能对图表的每一个细节进行精细控制;而 Seaborn 则是在 Matplotlib 的基础上构建的高级库,它专注于统计图表的绘制,以更少的代码提供更美观、更具信息量的默认样式。它们的关系更像是“地基与精装修”,一个提供骨架,一个负责美化和简化复杂任务。

解决方案

要高效地使用 Matplotlib 和 Seaborn 进行数据可视化,我们通常会采取一种互补的策略。我的经验是,先用 Seaborn 快速探索数据,因为它默认的样式和统计功能确实能省去不少功夫,尤其是在进行探索性数据分析(EDA)时。比如,想看看两个变量的分布关系,

sns.scatterplot()
几乎是我的第一选择。而当我对图表的特定元素有更苛刻的要求,或者需要将多个子图以非常规的方式组合时,我就会深入到 Matplotlib 的 API 中,进行精细的调整。

一个典型的流程可能是这样:

  1. 数据准备: 确保数据以 Pandas DataFrame 的形式存在,这是 Seaborn 最友好的输入格式。
  2. 快速探索(Seaborn 主导): 使用
    sns.histplot()
    查看单变量分布,
    sns.pairplot()
    快速概览多变量关系,或者
    sns.lineplot()
    绘制时间序列趋势。Seaborn 的这些高级函数能让你迅速获得对数据的第一印象。
  3. 细节调整与定制(Matplotlib 辅助/主导): 发现某个图表需要更明确的标题、更精确的轴标签、特定的图例位置,或者需要添加一些自定义的文本注释时,Matplotlib 的
    plt.title()
    ,
    ax.set_xlabel()
    ,
    ax.text()
    等函数就派上用场了。很多时候,我们会在
    sns.plot_function(...)
    之后,接着调用 Matplotlib 的函数来“润色”图表。
  4. 复杂布局(Matplotlib 主导): 如果你需要在一个图中绘制多个子图(比如 2x2 的矩阵),并且每个子图都需要独立控制,那么
    plt.subplots()
    结合 Matplotlib 的面向对象接口会是更清晰、更强大的选择。

如何选择 Matplotlib 还是 Seaborn?

这几乎是每个初学者都会遇到的问题,甚至是有经验的开发者也会在心里盘算一下。我的看法是,这并非一道非此即彼的选择题,更像是在厨房里选择工具:你是要一把万能的瑞士军刀(Matplotlib),还是一个专门用来切菜的厨师刀(Seaborn)?

当你需要绝对的控制力时,Matplotlib 是不二之选。想象一下,你正在为一篇学术论文准备插图,图表的每一个线条粗细、字体大小、颜色渐变,甚至是图例的边框样式,都必须严格符合规范。Matplotlib 的底层 API 允许你深入到图表的每一个像素,进行微调。它的学习曲线相对陡峭,因为它暴露了大量的参数和对象,但一旦你掌握了

Figure
Axes
的概念,你就能构建出任何你能想象到的静态图表。我有时会用 Matplotlib 来制作一些非常规的自定义图表,比如复杂的地理空间图或者一些独特的统计图形,这时候 Seaborn 的预设功能可能就显得有些束手束脚了。

而当你追求效率和美观,尤其是在进行统计数据分析时,Seaborn 简直是神来之笔。它以更简洁的代码,就能生成视觉效果更佳、信息量更大的图表。Seaborn 默认的颜色方案和字体大小通常比 Matplotlib 的默认设置更“现代”和“专业”。更重要的是,Seaborn 内置了许多统计功能,比如在绘制散点图时自动添加回归线和置信区间,或者在分组柱状图中自动处理分类变量。这对于快速探索数据、理解变量之间的关系来说,简直是效率倍增器。我个人在做日常的数据探索时,90% 的图表可能都是从 Seaborn 开始的。

所以,最佳实践往往是两者结合。用 Seaborn 快速出图,利用其强大的统计绘图能力和美观的默认样式;然后,如果需要进一步的个性化定制,或者处理一些 Seaborn 不擅长的复杂布局,就切换到 Matplotlib 的 API 进行精修。它们之间并没有壁垒,反而能无缝协作。

掌握 Matplotlib 绘图的核心要素是什么?

要真正玩转 Matplotlib,理解其核心组件是关键。这就像你学画画,得先知道什么是画布、什么是画笔、什么是颜料。在 Matplotlib 里,主要有几个概念:

  1. Figure (画布):你可以把它想象成你用来作画的整张纸或者整个画板。它是所有图表的顶层容器。一个

    Figure
    可以包含一个或多个
    Axes
    。通常,我们通过
    fig = plt.figure()
    或者更常用、更方便的
    fig, ax = plt.subplots()
    来创建一个 Figure 对象。

  2. Axes (坐标系/子图):这才是你真正进行绘图的区域。一个

    Figure
    可以有多个
    Axes
    ,每个
    Axes
    都有自己的 X 轴和 Y 轴,以及自己的标题、标签、图例等。这是 Matplotlib 面向对象接口的核心,也是我推荐大家优先使用的方式。当你用
    fig, ax = plt.subplots()
    创建时,
    ax
    就是一个
    Axes
    对象(或者一个
    Axes
    对象的数组,如果创建了多个子图)。所有的绘图命令,比如
    ax.plot()
    ,
    ax.scatter()
    ,
    ax.bar()
    等,都是在
    Axes
    对象上调用的。

  3. Plotting Functions (绘图函数):这些是你在

    Axes
    对象上执行具体绘图操作的函数。例如:

    95Shop仿醉品商城
    95Shop仿醉品商城

    95Shop可以免费下载使用,是一款仿醉品商城网店系统,内置SEO优化,具有模块丰富、管理简洁直观,操作易用等特点,系统功能完整,运行速度较快,采用ASP.NET(C#)技术开发,配合SQL Serve2000数据库存储数据,运行环境为微软ASP.NET 2.0。95Shop官方网站定期开发新功能和维护升级。可以放心使用! 安装运行方法 1、下载软件压缩包; 2、将下载的软件压缩包解压缩,得到we

    下载
    • ax.plot(x, y)
      :绘制线图。
    • ax.scatter(x, y)
      :绘制散点图。
    • ax.hist(data)
      :绘制直方图。
    • ax.bar(x, height)
      :绘制柱状图。
    • 还有很多,它们各自对应不同的图表类型。
  4. Customization (定制化):这是 Matplotlib 强大之处的体现。通过

    Axes
    对象的方法,你可以控制图表的每一个细节:

    • ax.set_title("我的图表标题")
      :设置子图标题。
    • ax.set_xlabel("X轴标签")
      ,
      ax.set_ylabel("Y轴标签")
      :设置轴标签。
    • ax.set_xlim(min_val, max_val)
      ,
      ax.set_ylim(min_val, max_val)
      :设置轴的显示范围。
    • ax.legend()
      :显示图例。
    • ax.tick_params()
      :调整刻度线的样式。
    • fig.savefig("my_plot.png")
      :保存图表。

理解并熟练运用

Figure
Axes
的面向对象接口,而不是仅仅使用
plt.plot()
这种全局函数(虽然在简单场景下也可用),会让你在处理复杂图表时如鱼得水。它提供了一种更清晰、更可控的方式来管理你的可视化。

import matplotlib.pyplot as plt
import numpy as np

# 创建一个 Figure 和一个 Axes
fig, ax = plt.subplots(figsize=(8, 5))

# 在 Axes 上绘制数据
x = np.linspace(0, 10, 100)
y1 = np.sin(x)
y2 = np.cos(x)

ax.plot(x, y1, label='Sin(x)', color='blue', linestyle='--')
ax.plot(x, y2, label='Cos(x)', color='red', marker='o', markersize=3, markevery=10)

# 定制 Axes 的属性
ax.set_title("正弦与余弦曲线", fontsize=16)
ax.set_xlabel("X 值", fontsize=12)
ax.set_ylabel("Y 值", fontsize=12)
ax.legend(loc='upper right')
ax.grid(True, linestyle=':', alpha=0.7)
ax.set_xlim(0, 10)
ax.set_ylim(-1.2, 1.2)

# 显示图表
plt.show()

Seaborn 如何简化复杂统计图表的绘制?

Seaborn 的魅力在于它提供了一套高级的、面向数据集的 API,能够以极少的代码绘制出在 Matplotlib 中需要大量配置才能实现的复杂统计图表。它就像是 Matplotlib 的一个“智能助手”,预设了许多统计绘图的最佳实践和美学标准。

Seaborn 简化复杂图表绘制的主要方式有:

  1. 高层级函数(High-level functions):Seaborn 提供了许多针对特定统计分析场景设计的高级函数。例如,

    sns.scatterplot()
    不仅能绘制散点图,还能通过
    hue
    ,
    size
    ,
    style
    等参数,在同一张图上表示第三、第四、第五个变量,极大地丰富了信息量。
    sns.pairplot()
    更是强大,只需一行代码就能生成数据集中所有数值变量两两之间的散点图和单变量分布图矩阵,这对于快速理解数据集的整体结构和变量间关系非常有帮助。

  2. 内置统计计算:许多 Seaborn 函数在绘图的同时,会自动执行一些统计计算。比如

    sns.lineplot()
    在绘制趋势线时,默认会显示置信区间;
    sns.regplot()
    会自动拟合回归线。这省去了我们手动计算这些统计量的麻烦,直接在视觉上呈现统计洞察。

  3. 美观的默认样式:Seaborn 的默认颜色板、字体、背景网格等都经过精心设计,通常比 Matplotlib 的默认设置更具专业感和吸引力。你可以通过

    sns.set_theme()
    或者
    sns.set_style()
    轻松切换不同的主题,让你的图表看起来更统一、更美观。

  4. 对 Pandas DataFrame 的原生支持:Seaborn 的函数通常直接接受 Pandas DataFrame 作为输入,你可以直接通过列名来指定 X 轴、Y 轴或分组变量,这比 Matplotlib 中需要手动提取 Series 数据再绘图要方便得多。

  5. 分类变量的可视化:Seaborn 在处理分类数据方面尤为出色,提供了一系列专门的函数,如

    sns.boxplot()
    sns.violinplot()
    sns.stripplot()
    sns.swarmplot()
    以及它们的统一接口
    sns.catplot()
    。这些函数能清晰地展示不同类别数据的分布、离散程度和异常值,这在 Matplotlib 中可能需要更多的代码和思考才能实现。

import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np

# 加载一个内置数据集
iris = sns.load_dataset("iris")

# 使用 Seaborn 绘制复杂统计图表
# 示例1: pairplot 快速概览多变量关系
# fig1 = plt.figure(figsize=(10, 8)) # 可以先创建 Figure,再让 Seaborn 绘图到其上
sns.pairplot(iris, hue="species", diag_kind="kde", palette="viridis")
plt.suptitle("鸢尾花数据集多变量关系概览", y=1.02) # 使用 Matplotlib 添加总标题
plt.show()

# 示例2: 带有置信区间的线图,展示不同物种花瓣长度随花瓣宽度的变化趋势
plt.figure(figsize=(10, 6))
sns.lineplot(data=iris, x="petal_width", y="petal_length", hue="species", marker="o", errorbar="sd")
plt.title("不同鸢尾花物种花瓣长度与宽度的关系及标准差")
plt.xlabel("花瓣宽度 (cm)")
plt.ylabel("花瓣长度 (cm)")
plt.grid(True, linestyle=':', alpha=0.6)
plt.show()

# 示例3: 小提琴图,展示不同物种萼片长度的分布
plt.figure(figsize=(8, 6))
sns.violinplot(data=iris, x="species", y="sepal_length", palette="muted")
plt.title("不同鸢尾花物种萼片长度分布")
plt.xlabel("物种")
plt.ylabel("萼片长度 (cm)")
plt.show()

相关专题

更多
python开发工具
python开发工具

php中文网为大家提供各种python开发工具,好的开发工具,可帮助开发者攻克编程学习中的基础障碍,理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容,供大家免费下载使用。

716

2023.06.15

python打包成可执行文件
python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章,大家可以免费的下载体验。

626

2023.07.20

python能做什么
python能做什么

python能做的有:可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

739

2023.07.25

format在python中的用法
format在python中的用法

Python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

617

2023.07.31

python教程
python教程

Python已成为一门网红语言,即使是在非编程开发者当中,也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章,大家可以免费体验学习。

1236

2023.08.03

python环境变量的配置
python环境变量的配置

Python是一种流行的编程语言,被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后,我们需要配置环境变量,以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

547

2023.08.04

python eval
python eval

eval函数是Python中一个非常强大的函数,它可以将字符串作为Python代码进行执行,实现动态编程的效果。然而,由于其潜在的安全风险和性能问题,需要谨慎使用。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

575

2023.08.04

scratch和python区别
scratch和python区别

scratch和python的区别:1、scratch是一种专为初学者设计的图形化编程语言,python是一种文本编程语言;2、scratch使用的是基于积木的编程语法,python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容,供大家免费下载体验。

699

2023.08.11

php源码安装教程大全
php源码安装教程大全

本专题整合了php源码安装教程,阅读专题下面的文章了解更多详细内容。

7

2025.12.31

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 0.6万人学习

Django 教程
Django 教程

共28课时 | 2.6万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.0万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号