森林野火故事2.0：一眼看穿！使用 Panel 和 hvPlot 可视化 ⛵

2023年10月29日上午9:17 • Python • 阅读 38

💡 作者：韩信子@ShowMeAI
📘 数据分析实战系列：https://www.showmeai.tech/tutorials/40
📘 本文地址：https://www.showmeai.tech/article-detail/335
📢 声明：版权所有，转载请联系平台与作者并注明出处
📢 收藏ShowMeAI查看更多精彩内容

📘Panel; 是 Python 中一个非常棒的可以用作制作数据仪表板的工具库，基于它可以轻松构建数据可视化看板。

在本篇内容中，ShowMeAI 综合 Python 可视化与呈现技能，使用 Panel 制作一个仪表盘看板，可以交互查看美国野火记录的信息。

💡 导入工具库

我们本次需要用到的工具库包括数据库工具、Python 数据处理工具、可视化工具和看板工具，我们先把这些工具库导入，代码如下：

数据库
import sqlite3

数据处理
import numpy as np
import pandas as pd

可视化与仪表盘
import holoviews as hv
import colorcet as cc
import panel as pn

from holoviews.element.tiles import EsriImagery
from datashader.utils import lnglat_to_meters
import hvplot.pandas
hv.extension('bokeh')

💡 数据准备

用于本次可视化的数据集包含 1992 年至 2015 年间在美国发生的超过 180 万起野火。🏆 美国野火数据集可以在 ShowMeAI 的百度网盘地址下载。

🏆 实战数据集下载（百度网盘）：公✦众✦号『ShowMeAI研究中心』回复『实战』，或者点击这里获取本文 [28]基于Panel和hvPlot的可视化交互看板实战案例『 美国野火 FPA_FOD_20170508.sqlite 数据集』

⭐ ShowMeAI官方GitHub：https://github.com/ShowMeAI-Hub

我们希望构建一个数据仪表板，帮助我们更好地了解导致这些野火的原因、发生地点等信息。我们导入数据并选出需要的信息，代码如下：

连接数据库
conn = sqlite3.connect('../data/FPA_FOD_20170508.sqlite')

选取信息：经纬度、原因描述、火势大小与等级、日期、所在州、年份 等
df = pd.read_sql_query("SELECT LATITUDE, LONGITUDE, STAT_CAUSE_DESCR, FIRE_SIZE, FIRE_SIZE_CLASS, DISCOVERY_DATE, CONT_DATE, STATE, FIRE_YEAR FROM fires", conn)

数据中有一些不在美国的记录，删除它们
df = df.loc[(df.loc[:,'STATE']!='AK') & (df.loc[:,'STATE']!='HI') & (df.loc[:,'STATE']!='PR')]

计算野火持续时间
df['BURN_TIME'] = df['CONT_DATE'] - df['DISCOVERY_DATE']

查看数据
df.head()

💡 野火地图

我们先把所有历史火灾绘制成热度地图，这样我们可以直观看到空间分布。借助 📘hvPlot 可以很容易完成（它利用 Datashader 来栅格化我们的 180 万个点，使得它们更易于渲染）。

具体的代码如下：

map_tiles = EsriImagery().opts(alpha=0.5, width=700, height=480, bgcolor='black')
plot = df.hvplot(
    'LONGITUDE',
    'LATITUDE',
    geo=True,
    kind='points',
    rasterize=True,
    cmap=cc.fire,
    cnorm='eq_hist',
    colorbar=True).opts(colorbar_position='bottom', xlabel='', ylabel='')
map_tiles * plot

简单的一组代码即可实现上述可视化结果，hvPlot 是一个非常棒的空间可视化工具库，它利用了其他 📘Holoviz 库——📘Holoviews、📘Geoviews、📘Datashader 和 📘Colorcet，所以可以极大简化创建大型数据集的交互式地图所需步骤。

💡 带时间滑块的仪表板

Panel 的小部件让我们可以访问各种方法来操作和切分我们的数据子集可视化，例如对时间序列数据可切分： 加入选择年份的滑块。

使用 Panel 制作这种仪表板，分为3个步骤：

① 定义一个小部件，例如用于选择年份或下拉列表的整数滑块。
② 定义一个绘图函数，将滑块中的年份值作为输入。
③ 布局和渲染我们的仪表板。

为时间序列构建滑动小组件
year = pn.widgets.IntSlider(name='Year Slider', width=300,
                                 start=1992, end=2015, value=(1993),
                                 step=1,value_throttled=(1993))

展示当前年份
@pn.depends(year.param.value_throttled)
def year_selected(year):
    return '## Wildfires Across the US in {}'.format(year)

实际绘图函数
@pn.depends(year.param.value_throttled)
def plot_map(year):
    year_df = df[df['FIRE_YEAR'] == year].copy()
    plot = year_df.hvplot(
        'LONGITUDE',
        'LATITUDE',
        geo=True,
        kind='points',
        rasterize=True,
        cmap=cc.fire,
        cnorm='eq_hist',
        colorbar=True).opts(colorbar_position='bottom', xlabel='', ylabel='')
    return map_tiles * plot

dashboard = pn.WidgetBox(pn.Column(pn.Row(year_selected, year),
                         pn.Row(pn.bind(plot_map, year)), align="start",
                         sizing_mode="stretch_width"))

💡 更简单的构建方式

当我们的绘图只有一个小部件要显示时，有一种更简单的方式：我们可以改为使用 .interactive制作我们的 DataFrame 和数据管道的交互式副本。

下面我们用一个示例来演示如何使用这个方法：这次我们的条件是『火灾的原因』，我们让地图只显示每个原因下的火灾。

select_cause = pn.widgets.Select(
    options = df['STAT_CAUSE_DESCR'].value_counts().index.tolist(),
    name = 'Cause')

动态交互
dfi = df.interactive

iplot = dfi[dfi['STAT_CAUSE_DESCR']==select_cause].hvplot(
    'LONGITUDE',
    'LATITUDE',
    geo=True,
    kind='points',
    rasterize=True,
    cmap=cc.fire,
    cnorm='eq_hist',
    colorbar=True).opts(colorbar_position='bottom', xlabel='', ylabel='', title='Wildfires by Cause from 1992-2015')

map_tiles.opts(level='underlay') * iplot

💡 组合仪表板

我们可以构建更强大的组合仪表盘，它让我们能够同时查看数据的多个维度信息。下面我们创建一些可视化图例，然后使用 Panel 将它们组合在一起。

💦 火势大小

我们先绘制每个规模等级发生的火灾数量：野火按燃烧区域的大小进行分类，A 级最小，G 级最大。

@pn.depends(year.param.value_throttled)
def plot_class(year):
    year_df = df[df['FIRE_YEAR'] == year].copy()
    count_df = pd.DataFrame(year_df.groupby('FIRE_SIZE_CLASS').size(), columns=['Count'])
    count_df['Fire Class'] = count_df.index
    return count_df.hvplot.bar(x='Fire Class', y='Count', c='Fire Class', cmap='fire',
                legend=False).opts(xlabel="Fire Size Class", ylabel="Number of Fires",
                title="Wildfires in {} Grouped by Size Classification".format(year))

plot_class(2006)

注意到上述绘图函数将『年份』作为参数，这样它可以在滑块值更改时对数据进行子集切分和呈现。拿到对应的数据子集后，我们把它按大小分类进行分组，并使用 .size()计算每组的火灾次数。

💦 起火原因 & 持续时长

下面我们对『起火原因和对应的持续时长』进行分析可视化（注意，这里和上面的模块一样，也是传入年份作为参数，这样我们最后的组合绘图，可以有统一的数据子集切分方式）。

@pn.depends(year.param.value_throttled)
def plot_cause_burn(year):
    year_df = df[df['FIRE_YEAR'] == year].copy()
    caused_df = pd.DataFrame(year_df.groupby('STAT_CAUSE_DESCR')[['BURN_TIME']].mean().sort_values('BURN_TIME'))
    caused_df['Fire Cause'] = caused_df.index
    return caused_df.hvplot.barh(x='Fire Cause', y='BURN_TIME',
                                 c='Fire Cause', cmap='fire_r', legend=False).opts(
                                 ylabel="Burn Time (Days)",
                                 title="Wildfire Burn time Grouped by Cause in {}".format(year))

plot_cause_burn(2003)

💦 起火原因 & 火灾数量

下面我们对『起火原因和对应的数量』进行分析可视化。

@pn.depends(year.param.value_throttled)
def plot_cause_count(year):
    year_df = df[df['FIRE_YEAR'] == year].copy()
    caused_df = pd.DataFrame(year_df.groupby('STAT_CAUSE_DESCR').size(), columns=['Count']).sort_values('Count')
    caused_df['Fire Cause'] = caused_df.index
    return caused_df.hvplot.barh(x='Fire Cause', y='Count',
                                 c='Fire Cause', cmap='fire_r',
                                 legend=False).opts(ylabel="Number of Fires",
                                 title="Number of Wildfires Grouped by Cause in {}".format(year))

plot_cause_count(2003)

对比上图，我们可以看到一些有趣差异，例如：

吸烟带来第2燃烧时长的野火，而它在引发的野火总数中排名第9。
除了闪电之外，燃烧时间最长的火灾并不是最频繁发生的火灾。

这也解释了为什么野火难以扑灭，它们通常发生在更偏远的地方，很难及早控制。闪电、吸烟和营火都有可能在这些地区引发火灾，因为那里有大量木材可燃烧，而周围很少有人在早期发现迹象并报告烟雾。

也有一些年份看起来完全不同，例如 2006 年，电力线故障导致大火平均燃烧数天。如下图所示：

pn.Row(plot_cause_count(2006) , plot_cause_burn(2006), width=1000)

这里需要注意的是 Panel 和 hvPlot 如何识别这两个子图共享相同的 y 轴。

💦 分析结果组装

现在我们已经从不同维度进行了分析，我们使用小部件把它们进行组合，使我们可以沿着时间轴动态选择和做一些数据探索，构建组合仪表板的代码如下：

plots_box = pn.WidgetBox(pn.Column(pn.Row(pn.bind(fire_count, year), year),
                                   pn.Row(pn.bind(plot_map, year), pn.bind(plot_class, year)) ,
                                   pn.Row(pn.bind(plot_cause_count, year), pn.bind(plot_cause_burn, year)), align="start",
                                   width=800, sizing_mode="stretch_width"))

dashboard = pn.Row(plots_box, sizing_mode="stretch_width")

上面只是截取的一些gif动图，大家快快实际操作一下吧！会有更清晰的认识。

💡 总结

在本篇内容中 ShowMeAI 给大家讲解了使用 hvPlot 和 Panel 构建各种组合可视化看板仪表盘的方法，当我们需要进行数据探索和分析的时候，简单的一些数据分析可视化用 Pandas 和 Seaborn 等就可以快速完成，当我们需要一个交互式探索分析工具时，使用hvPlot 和 Panel 是一个非常棒的选择。

参考资料

📘 panel 文档：https://panel.holoviz.org/
📘 hvPlot 文档：https://hvplot.holoviz.org/
📘 holoviz 文档：https://holoviz.org/tutorial/index.html
📘 holoviews 文档：https://holoviews.org/gallery/index.html
📘 Geoviews 文档：https://geoviews.org/
📘 Datashader 文档：https://datashader.org/
📘 Colorcet 文档：https://colorcet.holoviz.org/

Original: https://www.cnblogs.com/showmeai/p/16914221.html
Author: ShowMeAI
Title: 森林野火故事2.0：一眼看穿！使用 Panel 和 hvPlot 可视化 ⛵

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/807444/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

数据分析作业（一）利用Python分析学生成绩

利用Python分析学生成绩一、题目描述二、解题步骤 * 运行环境题目分析三、完整代码四、运行结果五、参考文献附录 * 附录A – 更新记录附录B 相关…

Python 2023年8月2日
0091
三、Pytest自动化测试框架 —Pytest的基本使用（二）

目录前言 ###文章内容有配套的学习视频和笔记都放在了文章末尾### 5、Pytest参数介绍 6、Pytest框架用例命名规则 7、Pytest Exit Code说明 8、在…

Python 2023年9月11日
0037
所谓工作能力强，其实就这五点

### 回答1：索引是数据库中的一种数据结构，用于快速定位和访问数据。它是一种数据目录，可以帮助我们快速地找到数据库中的记录。索引通常是由一组键值和对应记录的指针组成的，这些键值…

Python 2023年10月27日
0032
新BugKu-web篇-Flask_FileUpload

新BugKu-web篇-Flask_FileUpload 首先自己踩了个坑，就是上传文件成功后，我以为会直接回显，结果还是需要查看源代码，这道题需要了解Python的后缀名pyth…

Python 2023年8月13日
0035
Python安装教程-手把手教你安装

文章目录 Python安装教程-手把手教你安装 * 一、进入Python官网二、打开Python安装包进行安装三、验证Python是否安装成功 Python安装教程-手把手教你…

Python 2023年8月1日
0051
python playsound播放时关闭_Python3 超好用的音频播放模块 playsound

Python3 超好用的音频播放模块 playsound前沿playsound模块介绍一、模块安装二、使用三、使用中遇到的问题 python2有个很好用的音频播放模块MP3play…

Python 2023年9月21日
0065
pandas将df保存为excel，如何避免长数据序号被保存为科学计数法？解答各种坑

使用pandas处理包含产品序号的数据，序号是一串长的数字符号，遇到一系列科学技术法相关的问题。查阅了针对这个问题的一些已有解答，发现不能完全解决问题，也没有解释清楚问题出现的原因…

Python 2023年8月15日
0095
python–敲击木鱼积累功德小项目（更新版（2））

前言：前几天上课闲着没事写了一个python敲击木鱼积累功德的小项目，当时纯粹就是写着玩，回顾一下鼠标事件的东西还记不记得，发现这个博客的点赞和收藏量还挺高的，我当时也没有把它当回…

Python 2023年10月10日
0032
《头号玩家》AI电影调研报告（三）

【 AR 市场正在迅猛增长】据《工业增强现实现状2017》报告中所述，AR不再只是值得期待的新兴技术。2018年，投资此类技术已成为很多组织机构的关键战略，尤其是对于涉及复杂的制…

Python 2023年10月26日
0044
【python爬虫】 python 爬取知乎的公开收藏夹

前言看看如何用 python 爬取知乎的公开收藏夹内容尝试第一个方法开始的时候用 python ，request 库进行的网页请求，在请求你的收藏夹总界面的时候还可以返回…

Python 2023年10月31日
0054
# BUGKU Simple_SSTI_1-2

BUGKU Simple_SSTI_1 提示需要传一个flag参数，Flask 是一个微型的 Python 开发的 Web 框架，由上可知flag在secret_key下，conf…

Python 2023年8月12日
0032
利用Python实现绘制3D爱心的代码分享

最近你是否也被李峋的爱心跳动代码所感动，心动不如行动，相同的代码很多，我们今天换一个玩法！构建一个三维的跳动爱心！嗯！这篇博客本着开源的思想！不是说谁对浪漫过敏的目录环境介绍 …

Python 2023年9月6日
0054
pytest框架中前后置的处理-setup及fixture的简介-2

在编写场景自动化的过程，我们往往需要进行前后置，本文章主要介绍pytest三种前后置：setup/teardown，setup_class/teardown_class:主要作用于…

Python 2023年9月9日
0056
python数据可视化-matplotlib入门(1)–安装及绘制简单的曲线

一、安装matplotlib 1）由于已安装anaconda，可直接打开anaconda prompt，再用命令pip install matplotlib进行安装，因镜像问题，可…

Python 2023年11月3日
0037
Python Web实战：Python+Django+MySQL实现基于Web版的增删改查

本文使用Python Web框架Django连接和操作MySQL数据库学生信息管理系统(SMS),主要包含对学生信息增删改查功能。 1.创建项目(sms) 创建Django项目 d…

Python 2023年8月5日
0071
【2-14情人节-献给天下有情人】测试圈相亲平台开发流程（1）: vue+django 环境部署

（这里郑重声明，本平台及算法谨用于学习和研究匹配算法和平台开发技术，并非真实商业化公开平台，既不上线也不使用）前言目前猜测的字段有这么多：虽然记下来了，但是要想匹配则困难的多…

Python 2023年8月5日
0081

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

森林野火故事2.0：一眼看穿！使用 Panel 和 hvPlot 可视化 ⛵

💦 火势大小

💦 起火原因 & 持续时长

💦 起火原因 & 火灾数量

💦 分析结果组装

大家都在看