Python数据可视化工具matplotlib(七)– 箱型图

箱型图

箱型图:又称为盒须图、盒式图、盒状图或箱线图,是一种用作显示一组数据分散情况资料的统计图
包含一组数据的:最大值、最小值、中位数、上四分位数(Q1)、下四分位数(Q3)、异常值
① 中位数 → 一组数据平均分成两份,中间的数
② 下四分位数Q1 → 是将序列平均分成四份,计算(n+1)/4与(n-1)/4两种,一般使用(n+1)/4
③ 上四分位数Q3 → 是将序列平均分成四份,计算(1+n)/4*3=6.75
④ 内限 → T形的盒须就是内限,最大值区间Q3+1.5IQR,最小值区间Q1-1.5IQR (IQR=Q3-Q1)
⑤ 外限 → T形的盒须就是内限,最大值区间Q3+3IQR,最小值区间Q1-3IQR (IQR=Q3-Q1)
⑥ 异常值 → 内限之外 – 中度异常,外限之外 – 极度异常

plt.plot.box(), plt.boxplot()

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline

plt.plot.box()绘制

fig,axes = plt.subplots(2,1,figsize=(10,8))
df = pd.DataFrame(np.random.rand(10, 5), columns=['A', 'B', 'C', 'D', 'E'])
color = dict(boxes='DarkGreen', whiskers='DarkOrange', medians='DarkBlue', caps='Gray')

df.plot.box(ylim=[0,1.2],
           grid = True,
           color = color,
           ax = axes[0])

df.plot.box(vert=False,
            positions=[1, 4, 5, 6, 8],
            ax = axes[1],
            grid = True,
           color = color)

Python数据可视化工具matplotlib(七)-- 箱型图

plt.boxplot()绘制


df = pd.DataFrame(np.random.rand(10, 5), columns=['A', 'B', 'C', 'D', 'E'])
plt.figure(figsize=(10,4))

f = df.boxplot(sym = 'o',
               vert = True,
               whis = 1.5,
               patch_artist = True,
               meanline = False,showmeans=True,
               showbox = True,
               showcaps = True,
               showfliers = True,
               notch = False,
               return_type='dict'
              )
plt.title('boxplot')

for box in f['boxes']:
    box.set( color='b', linewidth=1)
    box.set( facecolor = 'b' ,alpha=0.5)
for whisker in f['whiskers']:
    whisker.set(color='k', linewidth=0.5,linestyle='-')
for cap in f['caps']:
    cap.set(color='gray', linewidth=2)
for median in f['medians']:
    median.set(color='DarkBlue', linewidth=2)
for flier in f['fliers']:
    flier.set(marker='o', color='y', alpha=0.5)

Python数据可视化工具matplotlib(七)-- 箱型图

df = pd.DataFrame(np.random.rand(10,2), columns=['Col1', 'Col2'] )
df['X'] = pd.Series(['A','A','A','A','A','B','B','B','B','B'])
df['Y'] = pd.Series(['A','B','A','B','A','B','A','B','A','B'])

df.boxplot(by = 'X')
df.boxplot(column=['Col1','Col2'], by=['X','Y'])

Python数据可视化工具matplotlib(七)-- 箱型图

Original: https://blog.csdn.net/d1240673769/article/details/118957923
Author: Jepson2017
Title: Python数据可视化工具matplotlib(七)– 箱型图

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/765537/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球