箱型图
箱型图:又称为盒须图、盒式图、盒状图或箱线图,是一种用作显示一组数据分散情况资料的统计图
包含一组数据的:最大值、最小值、中位数、上四分位数(Q1)、下四分位数(Q3)、异常值
① 中位数 → 一组数据平均分成两份,中间的数
② 下四分位数Q1 → 是将序列平均分成四份,计算(n+1)/4与(n-1)/4两种,一般使用(n+1)/4
③ 上四分位数Q3 → 是将序列平均分成四份,计算(1+n)/4*3=6.75
④ 内限 → T形的盒须就是内限,最大值区间Q3+1.5IQR,最小值区间Q1-1.5IQR (IQR=Q3-Q1)
⑤ 外限 → T形的盒须就是内限,最大值区间Q3+3IQR,最小值区间Q1-3IQR (IQR=Q3-Q1)
⑥ 异常值 → 内限之外 – 中度异常,外限之外 – 极度异常
plt.plot.box(), plt.boxplot()
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
plt.plot.box()绘制
fig,axes = plt.subplots(2,1,figsize=(10,8))
df = pd.DataFrame(np.random.rand(10, 5), columns=['A', 'B', 'C', 'D', 'E'])
color = dict(boxes='DarkGreen', whiskers='DarkOrange', medians='DarkBlue', caps='Gray')
df.plot.box(ylim=[0,1.2],
grid = True,
color = color,
ax = axes[0])
df.plot.box(vert=False,
positions=[1, 4, 5, 6, 8],
ax = axes[1],
grid = True,
color = color)
plt.boxplot()绘制
df = pd.DataFrame(np.random.rand(10, 5), columns=['A', 'B', 'C', 'D', 'E'])
plt.figure(figsize=(10,4))
f = df.boxplot(sym = 'o',
vert = True,
whis = 1.5,
patch_artist = True,
meanline = False,showmeans=True,
showbox = True,
showcaps = True,
showfliers = True,
notch = False,
return_type='dict'
)
plt.title('boxplot')
for box in f['boxes']:
box.set( color='b', linewidth=1)
box.set( facecolor = 'b' ,alpha=0.5)
for whisker in f['whiskers']:
whisker.set(color='k', linewidth=0.5,linestyle='-')
for cap in f['caps']:
cap.set(color='gray', linewidth=2)
for median in f['medians']:
median.set(color='DarkBlue', linewidth=2)
for flier in f['fliers']:
flier.set(marker='o', color='y', alpha=0.5)
df = pd.DataFrame(np.random.rand(10,2), columns=['Col1', 'Col2'] )
df['X'] = pd.Series(['A','A','A','A','A','B','B','B','B','B'])
df['Y'] = pd.Series(['A','B','A','B','A','B','A','B','A','B'])
df.boxplot(by = 'X')
df.boxplot(column=['Col1','Col2'], by=['X','Y'])
Original: https://blog.csdn.net/d1240673769/article/details/118957923
Author: Jepson2017
Title: Python数据可视化工具matplotlib(七)– 箱型图
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/765537/
转载文章受原作者版权保护。转载请注明原作者出处!