python数据相关性绘图-散点图正态分布图回归图等及鸢尾花数据集可视化（附Python代码）

2023年6月16日下午8:47 • 人工智能 • 阅读 65

背景描述

数据分析中离不开对数据的相关性分析，并且需要把这些相关性进行可视化（绘图），以方便人们对各种特征属性之间呈现出来的相关性有更直接、清晰的感知和理解，提升数据的价值和数据挖掘的效益。本文以”鸢尾花数据集”为基础，主要关注于各种关系图的绘制，以及统计分析的数据可视化，提供和展示了16种关系图及6种统计分析图和回归图的方法（详见以下目录）。
由于从sklearn中获取的”鸢尾花”数据集中，目标值（iris.target)是”0″和”1″，这种类型的数据方便实现”机器学习”的建模，但是在数据绘图中不利于理解，因此我们会把数据集中的目标值与鸢尾花的品种(species)进行关联，转换为新的数据集，以获取更好的可视化结果。

                1. &#x7BB1;&#x578B;&#x56FE;
                2. &#x5C0F;&#x63D0;&#x7434;&#x56FE; -- violinplot(&#xFF09;
                3. &#x5206;&#x7C07;&#x6563;&#x70B9;&#x56FE;
                4. &#x6563;&#x70B9;&#x56FE; &#x4E0E; relplot()&#x51FD;&#x6570; (&#x9644;&#x65F6;&#x95F4;&#x5E8F;&#x5217;&#x56FE;&#x793A;&#x4F8B;&#xFF09;
                5. &#x6563;&#x70B9;&#x77E9;&#x9635;&#x56FE;
                6. &#x76F4;&#x65B9;&#x56FE;&#x77E9;&#x9635;
                7. &#x5BC6;&#x5EA6;&#x56FE;
                8. &#x76F4;&#x65B9;&#x5BC6;&#x5EA6;&#x7EBF;&#x56FE;
                9. &#x70ED;&#x529B;&#x56FE;&#x53CA;&#x534A;&#x89D2;&#x70ED;&#x529B;&#x56FE;&#xFF08;&#x534A;&#x4E09;&#x89D2;&#xFF09;
                10. &#x5E73;&#x884C;&#x5750;&#x6807;&#x56FE;
                11. &#x591A;&#x53D8;&#x91CF;&#x8054;&#x5408;&#x5206;&#x5E03;&#x56FE; -- pairplot() &#x51FD;&#x6570;
                12. &#x591A;&#x7EC4;&#x5206;&#x7C7B;&#x91CD;&#x53E0;&#x5BC6;&#x5EA6;&#x56FE; -- joy plot() &#x51FD;&#x6570;
                13. &#x8054;&#x5408;&#x5206;&#x5E03;&#x56FE; -- jointplot() &#x51FD;&#x6570;

第三部分：统计分析图表及回归图

                 1. &#x68C0;&#x9A8C;&#x662F;&#x5426;&#x7B26;&#x5408;&#x6B63;&#x6001;&#x5206;&#x5E03; -- p_test,  Skewness(), Kurtosis()&#x7684;&#x8BA1;&#x7B97;
                 2. &#x6B63;&#x6001;&#x6982;&#x7387;&#x5206;&#x5E03;&#x56FE;
                 3. &#x6B63;&#x6001;&#x5206;&#x5E03;&#x56FE; -- norm.pdf() &#x51FD;&#x6570;&#x7684;&#x8BA1;&#x7B97;&#x4E0E;&#x7ED8;&#x5236;
                 4. &#x56DE;&#x5F52;&#x56FE; -- lmplot() &#x51FD;&#x6570;
                 5. &#x56DE;&#x5F52;&#x56FE; -- regplot() &#x51FD;&#x6570;
                 6. &#x56DE;&#x5F52;&#x56FE; -- lmplot() &#x51FD;&#x6570;

示例代码（Python代码）：

第一部分：鸢尾花数据集的获取与转换

鸢尾花数据集（Iris数据集）是一类多重变量分析的数据集。数据集包含150个数据样本，分为3类，每类50个数据，每个数据包含4个属性。通过花萼长度，花萼宽度，花瓣长度，花瓣宽度4个属性可以预测鸢尾花卉属于（Setosa，Versicolour，Virginica）三个种类中的哪一类。原数据集的目标值（iris.target）是”0″和”1″，但在数据可视化展示的时候，为了更清晰容易地理解数据的分类，我们需要将数据集中的目标值与鸢尾花的品种连接起来，即：把数据集中的编号”iris.target”与鸢尾花的品种连接，转换为新的数据集。

import numpy as np
import pandas as pd
import sklearn
from sklearn import datasets

&#x4ECE;sklearn&#x4E2D;&#x83B7;&#x53D6;&#x9E22;&#x5C3E;&#x82B1;&#x6570;&#x636E;&#x96C6;&#xFF0C;&#x5E76;&#x8F6C;&#x6362;&#x4E3A;DataFrame
iris = datasets.load_iris()
dataset = pd.DataFrame(iris.data, columns=iris.feature_names)
&#x6216;&#xFF1A;&#x66F4;&#x65B0;&#x7279;&#x5F81;&#x5217;&#x7684;&#x540D;&#x79F0;&#xFF0C;&#x5982;&#x201C;sepal_length&#x201D;
columns = [x.strip("(cm)").strip().replace(" ", "_") for x in iris.feature_names]
dataset = pd.DataFrame(iris.data, columns=columns)
dataset["target"]= iris.target

&#x5BF9;&#x6570;&#x636E;&#x96C6;&#x4E2D;&#x7684;&#x76EE;&#x6807;&#x503C;&#x8FDB;&#x884C;&#x9E22;&#x5C3E;&#x82B1;&#x54C1;&#x79CD;&#x7684;&#x8F6C;&#x6362;
dict_species = dict(zip(np.array([0, 1, 2]), iris.target_names,))
dict_species
dataset["speices"] = dataset["target"].map(dict_species)

&#x5C06;&#x6574;&#x7406;&#x597D;&#x7684;&#x6570;&#x636E;&#x96C6;&#x4EE5;csv&#x6587;&#x4EF6;&#x7684;&#x5F62;&#x5F0F;&#x4FDD;&#x5B58;&#x4E0B;&#x6765;&#xFF0C;&#x4E5F;&#x53EF;&#x4EE5;&#x4FDD;&#x5B58;&#x4E3A;Excel &#x6587;&#x4EF6;
outputfile = r"d:/iris.csv"
dataset.to_csv(outputfile)
dataset.info()

python数据相关性绘图-散点图正态分布图回归图等及鸢尾花数据集可视化（附Python代码）

保存下来的csv文件

第二部分：关系图的绘制

1. 箱型图

1.1 &#x7ED8;&#x5236;&#x7BB1;&#x578B;&#x56FE; -- &#x6839;&#x636E;&#x4E0D;&#x540C;&#x7C7B;&#x522B;&#x7684;&#x6570;&#x636E;&#x7ED8;&#x5236;&#x7BB1;&#x578B;&#x56FE;
data = dataset.drop(columns=["species"])
plt.boxplot(data, labels=data.columns, showmeans=True)
plt.show()

1. 2 &#x7ED8;&#x5236;&#x7BB1;&#x578B;&#x56FE; -- &#x6309;&#x9E22;&#x5C3E;&#x82B1;&#x7684;&#x54C1;&#x79CD;&#x5C55;&#x793A;&#x82B1;&#x843C;&#x957F;&#x5EA6;&#x548C;&#x82B1;&#x74E3;&#x957F;&#x5EA6;
fig, axes = plt.subplots(1, 2, figsize=(10, 5))
sns.boxplot(x="species", y="sepal_length", data=dataset, ax=axes[0])
sns.boxplot(x="species", y="petal_length", data=dataset, ax=axes[1])
plt.show()

2. 小提琴图 – violinplot() 函数

&#x7ED8;&#x5236;&#x5C0F;&#x63D0;&#x7434;&#x56FE;
import seaborn as sns
sns.violinplot(x="species", y="petal_length", data=dataset)
plt.show()

3. 分簇散点图

&#x5206;&#x7C07;&#x6563;&#x70B9;&#x56FE;
fig, axes = plt.subplots(1, 2, figsize=(10, 5))
sns.swarmplot(x="species", y="sepal_length", data=dataset, ax=axes[0])
sns.swarmplot(x="species", y="sepal_width", data=dataset, ax=axes[1])
plt.show()

4. 散点图

4.1 &#x7ED8;&#x5236;&#x6563;&#x70B9;&#x56FE;
fig = plt.subplots(1, 1, figsize=(8, 4))
sns.scatterplot(x="sepal_length", y="petal_length", hue="species",  data=dataset)
plt.show()

4.2 &#x6563;&#x70B9;&#x56FE; -- &#x4EE5;&#x989C;&#x8272;&#x6761;&#x533A;&#x5206;&#x7C7B;&#x522B;
plt.style.use("ggplot")
plt.figure(figsize=(7, 5))
cmap = plt.cm.get_cmap("RdBu")
sc = plt.scatter(x=dataset["sepal_length"], y=dataset["sepal_width"], c=iris.target, s=20, cmap=cmap)
bar = plt.colorbar(sc)
bar.set_label("species")
plt.xlabel("sepal_length")
plt.ylabel("sepal_width")
plt.show()

4.3 relplot()&#x51FD;&#x6570; -- &#x8BBE;&#x7F6E;kind="line"
import seaborn as sns
sns.set(style="ticks", palette="colorblind", color_codes=True)
sns.relplot(x = "sepal_length", y="sepal_width", data=dataset, kind="line")
plt.title("speal_length vs. speal_width")
plt.show()

4.4 relplot()&#x51FD;&#x6570; -- &#x8BBE;&#x7F6E;kind="scatter"
sns.relplot(x ="sepal_length", y="sepal_width", data=dataset)
plt.title("speal_length vs. speal_width (scatter)")
plt.show()

4.5 relplot()&#x51FD;&#x6570; -- &#x8BBE;&#x7F6E;kind="scatter",&#x5E76;&#x901A;&#x8FC7;hue&#x53C2;&#x6570;&#x505A;&#x7C7B;&#x522B;&#x533A;&#x5206;
sns.set(style="darkgrid", palette="muted", color_codes=True)
sns.relplot(x="sepal_length", y="sepal_width", hue="species",
                 size="species", sizes=(50, 120), style="species", data=dataset)
plt.title("speal_length vs. speal_width (by species)")
plt.show()

4.6 replot()&#x51FD;&#x6570;&#x7ED8;&#x5236;&#x65F6;&#x95F4;&#x5E8F;&#x5217;&#x56FE;&#x7684;&#x793A;&#x4F8B;&#xFF08;&#x672C;&#x793A;&#x4F8B;&#x662F;&#x6837;&#x54C1;&#x7684;&#x5E8F;&#x5217;&#x53F7;&#xFF09;
sns.set(style="whitegrid", palette="muted", color_codes=True)
sns.relplot(x=dataset.index, y="sepal_length", data=dataset,
                 hue="species", style="species", kind="line")
plt.title("sepal_length by index")
plt.show()

5. 散点矩阵图

5.1 &#x7ED8;&#x5236;&#x6563;&#x70B9;&#x56FE;&#x77E9;&#x9635;&#x793A;&#x4F8B;
import seaborn as sns
sns.set(style="ticks")
sns.pairplot(dataset, vars=["sepal_length", "petal_length"])
plt.show()

5.2 &#x8BBE;&#x5B9A;hue&#x53C2;&#x6570;&#x4EE5;&#x533A;&#x5206;&#x4E0D;&#x540C;&#x7684;&#x79CD;&#x7C7B;
import seaborn as sns
sns.set(style="ticks")
sns.pairplot(dataset, vars=["sepal_length", "petal_length"], hue="species")
plt.show()

6. 直方图矩阵

&#x7ED8;&#x5236;&#x76F4;&#x65B9;&#x56FE;&#x77E9;&#x9635; -- &#x5BF9;&#x6570;&#x636E;&#x96C6;&#x4E2D;&#x7684;&#x6240;&#x6709;&#x7279;&#x5F81;&#x5C5E;&#x6027;&#x7ED8;&#x5236;&#x76F4;&#x65B9;&#x56FE;
dataset.hist(sharex=True)
plt.show()

7. 绘制密度图

&#x7ED8;&#x5236;&#x5BC6;&#x5EA6;&#x56FE; -- &#x6574;&#x4E2A;&#x6570;&#x636E;&#x96C6;
dataset.plot(kind="kde")
plt.show()

8. 直方密度线图

 &#x7ED8;&#x5236;&#x76F4;&#x65B9;&#x5BC6;&#x5EA6;&#x7EBF;&#x56FE; -- &#x5E76;&#x6309;&#x4E0D;&#x540C;&#x54C1;&#x79CD;&#x5206;&#x522B;&#x5448;&#x73B0;sepal_length&#x6570;&#x636E;&#x7684;&#x5206;&#x5E03;&#x60C5;&#x51B5;
import seaborn as sns
kde: &#x662F;&#x5426;&#x663E;&#x793A;&#x6570;&#x636E;&#x5206;&#x5E03;&#x66F2;&#x7EBF;&#xFF0C;&#x9ED8;&#x8BA4;&#x4E3A;False
sns.displot(x="sepal_length", data=dataset, bins=20, kde=True, hue="species")
plt.show()

9. 热力图以及半角热力图

9.1 &#x7ED8;&#x5236;&#x70ED;&#x529B;&#x56FE;
data = dataset.drop(columns=["target"])
corrmat = data.corr()
k = 4
&#x6392;&#x5E8F;&#xFF1A;&#x6839;&#x636E;&#x76F8;&#x5173;&#x6027;&#x7A0B;&#x5EA6;&#x4ECE;&#x5927;&#x5230;&#x5C0F;&#x8FDB;&#x884C;&#x6392;&#x5E8F;&#xFF08;&#x9009;&#x5B9A;1&#x4E2A;&#x7279;&#x5F81;&#x5C5E;&#x6027;&#x4F5C;&#x4E3A;&#x5BF9;&#x7167;&#xFF09;
cols = corrmat.nlargest(k, "sepal_length")["sepal_length"].index
cm = np.corrcoef(data[cols].values.T)
sns.set(font_scale=1.25)
hm = sns.heatmap(cm, cbar=True, annot=True, square=True, fmt=".2f", annot_kws={"size": 10},
                               yticklabels=cols.values, xticklabels=cols.values)
plt.show()

9.2 &#x6784;&#x5EFA;&#x534A;&#x89D2;&#x70ED;&#x529B;&#x56FE;&#xFF1A;&#x65B9;&#x6CD5;&#x4E00;
corrmat = data.corr()
mask = np.ones_like(corrmat)
num = 4
mask[np.tril_indices(num)] = 0.   # &#x4E0A;&#x4E09;&#x89D2;&#x88AB;&#x5C4F;&#x853D;
mask[np.triu_indices(num)] = 0.   # &#x4E0B;&#x4E09;&#x89D2;&#x88AB;&#x5C4F;&#x853D;
sns.heatmap(corrmat, cbar=True, square=True, fmt=".2f", mask=mask,
                      annot=True, yticklabels=cols.values, xticklabels=cols.values)
plt.show()

9.3 &#x6784;&#x5EFA;&#x534A;&#x89D2;&#x70ED;&#x529B;&#x56FE;&#xFF1A;&#x65B9;&#x6CD5;&#x4E8C;
corrmat = data.corr()
mask = np.zeros_like(corrmat)
&#x5C06;mask&#x7684;&#x5BF9;&#x89D2;&#x7EBF;&#x53CA;&#x4EE5;&#x4E0A;&#x8BBE;&#x7F6E;&#x4E3A;True
mask[np.triu_indices_from(mask)] = True
sns.heatmap(corrmat, mask=mask, square=True, annot=True, fmt="0.2f")
plt.show()

10. 平行坐标图
平行坐标图（Paralllel Coordinates Plot) 是对于具有多个属性的一种可视化方法，可解决在维度增加时，散点矩阵变得不太有效的问题。在平行坐标图中，数据集的一行数据在平行坐标图中用一条折线表示，纵向是属性，横向是属性类别。安装方法：pip install pyecharts

&#x7ED8;&#x5236;&#x6570;&#x636E;&#x7684;&#x5E73;&#x884C;&#x5750;&#x6807;&#x56FE;&#x793A;&#x4F8B;
from pyecharts.charts import Parallel
import pyecharts.options as opts
import seaborn as sns
import numpy as np

data_ = np.array(dataset[["sepal_length", "sepal_width", "petal_length", "petal_width"]]).tolist()
parallel_axis = [{"dim": 0, "name": "&#x843C;&#x7247;&#x957F;&#x5EA6;"},
                 {"dim": 1, "name": "&#x843C;&#x7247;&#x5BBD;&#x5EA6;"},
                 {"dim": 2, "name": "&#x82B1;&#x74E3;&#x957F;&#x5EA6;"},
                 {"dim": 3, "name": "&#x82B1;&#x74E3;&#x5BBD;&#x5EA6;"}]
parallel = Parallel(init_opts=opts.InitOpts(width="600px", height="400px"))
parallel.add_schema(schema=parallel_axis)

parallel.add("&#x9E22;&#x5C3E;&#x82B1;&#xFF08;iris&#xFF09;&#x7684;&#x5E73;&#x884C;&#x56FE;", data=data_, linestyle_opts=opts.LineStyleOpts(width=4, opacity=0.5))
parallel.render_notebook()

11. 多变量联合分布图 – pairplot() 函数

11.1 以散点图的形式循环展示数据属性之间的相关性

11.1&#xFF1A;&#x7ED8;&#x5236;&#x4EE5;&#x6563;&#x70B9;&#x56FE;&#x7684;&#x5F62;&#x5F0F;&#x5C55;&#x793A;&#x6570;&#x636E;&#x5C5E;&#x6027;&#x4E4B;&#x95F4;&#x7684;&#x76F8;&#x5173;&#x6027;
import seaborn as sns
plt.figure(figsize=(10, 8), dpi=80)
plot_setting = dict(s=80, edgecolor="white", linewidth=2.5)
sns.pairplot(dataset, kind="scatter", hue="species",  plot_kws=plot_setting)
plt.show()

11.2 以回归线的方式循环展示数据属性之间的相关性

11.2&#xFF1A;&#x7ED8;&#x5236;&#x4EE5;&#x56DE;&#x5F52;&#x7EBF;&#x7684;&#x65B9;&#x5F0F;&#x5FAA;&#x73AF;&#x5C55;&#x793A;&#x6570;&#x636E;&#x5C5E;&#x6027;&#x4E4B;&#x95F4;&#x7684;&#x76F8;&#x5173;&#x6027;
plt.figure(figsize=(10, 8), dpi=80)
sns.pairplot(dataset, kind="reg", hue="species")
plt.show()

11.3 &#x7ED8;&#x5236;2&#x4E2A;&#x7279;&#x5F81;&#x5C5E;&#x6027;&#x7684;&#x5173;&#x7CFB;&#xFF0C;&#x5E76;&#x4EE5;&#x989C;&#x8272;&#x548C;&#x7B26;&#x5408;&#x533A;&#x5206;&#x4E0D;&#x540C;&#x7684;&#x7C7B;&#x522B;
plt.style.use("ggplot")
sns.pairplot(data=dataset[["petal_length", "petal_width", "species"]],
                    hue="species", markers=["o", "*", "^"])
plt.show()

12. 多组分类重叠密度图 – Joyplot() 函数

多组分类重叠密度图（Joy plot）又称为”峰峦图”，是一种可视化大量分组数据的方法，通过部分堆叠、重叠的密度图来展示不同类别的密度曲线折叠状况，直观地在一个维度上呈现和比较不同组别数据的分布。
安装方法：pip install joyplot

Joy Plot
import joypy
plt.figure(figsize=(10, 6), dpi=80)
fig, axes = joypy.joyplot(dataset, column=["sepal_length", "sepal_width"], by="species", figsize=(10, 6),
                          grid=True, title="Sepal_length vs. Sepal_width")
plt.show()

13. 联合分布图 – jointplot() 函数

13.1 &#x8054;&#x5408;&#x5206;&#x5E03;&#x56FE; -- jointplot()
sns.set(style="darkgrid", palette="muted", color_codes=True)
sns.jointplot(x="sepal_length", y="sepal_width", data=dataset)
plt.show()

13.2 &#x8054;&#x5408;&#x5206;&#x5E03;&#x56FE; &#x4F7F;&#x7528;hue&#x53C2;&#x6570;&#x6765;&#x533A;&#x5206;&#x4E0D;&#x540C;&#x7684;&#x7C7B;&#x522B;
sns.set(style="darkgrid", palette="muted", color_codes=True)
sns.jointplot(x="petal_length", y="petal_width", hue="species", data=dataset)
plt.show()

第三部分：统计分析图表及回归图

1. 检验是否符合正态分布 – p_test, Skewness(), Kurtosis()的计算

1.1 &#x68C0;&#x67E5;&#x662F;&#x5426;&#x5C5E;&#x4E8E;&#x6B63;&#x6001;&#x5206;&#x5E03;&#x53CA;&#x504F;&#x5EA6;&#xFF08;Skewness&#xFF09;&#x548C;&#x5CF0;&#x5EA6;(Kurtosis)
print("&#x504F;&#x5EA6;(Skewness): %f" % dataset["sepal_length"].skew())
print("&#x5CF0;&#x5EA6;(Kurtosis): %f" % dataset["sepal_length"].kurt())
&#x5728;&#x7EDF;&#x8BA1;&#x5B66;&#x4E2D;&#xFF0C;&#x5CF0;&#x5EA6;&#xFF08;Kurtosis&#xFF09;&#x8861;&#x91CF;&#x5B9E;&#x6570;&#x968F;&#x673A;&#x53D8;&#x91CF;&#x6982;&#x7387;&#x5206;&#x5E03;&#x7684;&#x5CF0;&#x6001;&#x3002;
&#x5CF0;&#x5EA6;&#x9AD8;&#x5C31;&#x610F;&#x5473;&#x7740;&#x65B9;&#x5DEE;&#x589E;&#x5927;&#x662F;&#x7531;&#x4F4E;&#x9891;&#x5EA6;&#x7684;&#x5927;&#x4E8E;&#x6216;&#x5C0F;&#x4E8E;&#x5E73;&#x5747;&#x503C;&#x7684;&#x6781;&#x7AEF;&#x5DEE;&#x503C;&#x5F15;&#x8D77;&#x7684;&#x3002;

1.2&#x68C0;&#x9A8C;&#x6570;&#x636E;&#x7684;&#x6B63;&#x6001;&#x5206;&#x5E03;&#x53CA;p_test &#x7684;&#x8BA1;&#x7B97; -- &#x5206;&#x6790;petal_length&#x662F;&#x5426;&#x7B26;&#x5408;&#x6B63;&#x6001;&#x5206;&#x5E03;&#xFF1A;
import scipy.stats as ss
p_test= np.array(dataset["sepal_length"].T)
print(ss.normaltest(p_test))

from matplotlib import pyplot as plt
p_test = pd.Series(p_test)
p_test.plot(kind="kde")

2.2 &#x5206;&#x6790;petal_length&#x662F;&#x5426;&#x7B26;&#x5408;&#x6B63;&#x6001;&#x5206;&#x5E03;&#xFF1A;
import scipy.stats as ss
data_ = dataset[dataset["species"] == "setosa"]
p_test= np.array(data_["sepal_length"].T)
print(ss.normaltest(p_test))

from matplotlib import pyplot as plt
p_test = pd.Series(p_test)
p_test.plot(kind="kde")

2. 正态概率分布图

&#x6B63;&#x6001;&#x6982;&#x7387;&#x5206;&#x5E03;&#x56FE;&#xFF1A;-- histogram and normal probability plot
from scipy import stats
sns.distplot(dataset["sepal_length"], fit=norm)
fig = plt.figure()
res = stats.probplot(dataset["sepal_length"], plot=plt)

3. 正态分布图 – norm.pdf() 函数的计算与绘制

3.1 &#x7ED8;&#x5236;&#x6B63;&#x6001;&#x5206;&#x5E03;&#x56FE;
from scipy.stats import norm
fig, axes = plt.subplots()
sigma = dataset["sepal_length"].std()
mu = dataset["sepal_length"].mean()
num_bins = 20
x = dataset["sepal_length"]
n, bins, patches = axes.hist(x, num_bins, density=1)
&#x8BA1;&#x7B97;&#x6B63;&#x6001;&#x5206;&#x5E03;&#x6982;&#x7387;&#x5BC6;&#x5EA6;&#x51FD;&#x6570;
y = norm.pdf(bins, mu, sigma)
axes.plot(bins, y, "r--")
axes.set_title("sepal_length(cm)&#x7684;&#x6B63;&#x6001;&#x5206;&#x5E03;&#x56FE;")
fig.tight_layout()
plt.show()

3.2 &#x7ED8;&#x5236;&#x6B63;&#x6001;&#x5206;&#x5E03;&#x56FE; -- &#x5173;&#x6CE8;&#x4E8E;&#x67D0;&#x79CD;&#x54C1;&#x79CD;&#x7684;&#x82B1;&#x74E3;&#x957F;&#x5EA6;&#x7684;&#x6570;&#x636E;&#x5206;&#x6790;
mpl.rcParams["font.family"] = "SimHei"

data_ = dataset[dataset["species"]=="setosa"]
from scipy.stats import norm
fig, axes = plt.subplots()
sigma = data_["sepal_length"].std()
mu = data_["sepal_length"].mean()
num_bins = 20
x = data_["sepal_length"]
n, bins, patches = axes.hist(x, num_bins, density=1,color="g")
y = norm.pdf(bins, mu, sigma)
axes.plot(bins, y, "r--")
axes.set_title("Setosa: sepal_length(cm)&#x7684;&#x6B63;&#x6001;&#x5206;&#x5E03;&#x56FE;")
fig.tight_layout()
plt.show()

4. 回归图 – lmplot()函数

&#x7ED8;&#x5236;&#x56DE;&#x5F52;&#x56FE;
import seaborn as sns
sns.lmplot(x="sepal_length", y="petal_length", hue="species", data=dataset)
plt.show()

5. 回归图 – 使用regplot()函数

&#x7ED8;&#x5236;&#x7EBF;&#x6027;&#x56DE;&#x5F52;&#x56FE; -- &#x5206;&#x522B;&#x7ED8;&#x5236;
fig, axes = plt.subplots(1, 2, figsize=(8, 4))
sns.regplot(x="petal_length", y="petal_width", data=dataset, color="g", ax=axes[0])
sns.regplot(x="sepal_length", y="sepal_width", data=dataset, color="orange", ax=axes[1])
plt.show()

6. 回归图 – 使用lmplot()函数

&#x4F7F;&#x7528;lmplot()&#x51FD;&#x6570;&#x7ED8;&#x5236;&#x548C;&#x5448;&#x73B0;&#x4E0D;&#x540C;&#x7C7B;&#x522B;&#x7684;&#x4E24;&#x4E24;&#x7279;&#x5F81;&#x5C5E;&#x6027;&#x7684;&#x76F8;&#x5173;&#x60C5;&#x51B5;
plt.style.use("ggplot")
sns.lmplot(x="sepal_length", y="sepal_width", hue="species",
           data=dataset, fit_reg=False, size=5)
sns.lmplot(x="sepal_length", y="sepal_width", col="species", hue="species",
           data=dataset, fit_reg=True, size=3, aspect=0.9, col_wrap=3)
plt.show()

附录：

1. Joyplot() 函数的介绍
‘data：绘制数据集’
‘column’：使用data的中的有限列进行绘图
‘by=None’:分组列
‘gird=false：添加网格线
‘xlabelsize=none x轴标签的大小
‘ylabelsize=none y轴标签的大小
‘xrot=none x轴刻度线标签旋转角度
‘yrot=none y轴刻度线标签旋转角度
‘hist=flase显示直方图
‘fade=flase如果设定的是true，则显示渐变色
‘ylim’=’max共享y轴的刻度
ll=’true 曲线下的填充颜色
linecolor=’None；曲线的颜色
blackground=none:背景颜色
overlap=1:控制重叠程度
‘title’=none 添加图表的标题
‘colormap=none 色谱

Original: https://blog.csdn.net/weixin_45914452/article/details/125815353
Author: 若芷兰
Title: python数据相关性绘图-散点图正态分布图回归图等及鸢尾花数据集可视化（附Python代码）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/626516/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

基于卷积神经网络的高光谱分类 CNN+高光谱+印度松数据集

基于卷积神经网络的高光谱分类一、研究现状只考虑到高光谱图像的光谱特征，即： 1、提取特征(小波变换、Gabor纹理分析、形态学剖面) 2、利用分类方法分类(支持向量机、决策树、…

人工智能 2023年6月30日
0080
如何确定分类的阈值，如何确定哪个模型好呢

当时使用sigmoid时，如果确定分类的阈值呢？（使用sigmoid的多分类或者softmax的2分类，其实2分类的softmax就是sigmoid没区别）一般我们喜欢使用0….

人工智能 2023年7月1日
00124
【AC.HASH】OpenHarmony啃论文俱乐部——哈希技术：综述和分类(译)

本文出自 AC.HASH 团队，AC 产出本文的成员：中原工学院大二在校生（昵称:莫凡）我们在 OpenHarmony成长&…

人工智能 2023年7月2日
0080
PCA、聚类、LFDA 和 MDS 相关绘图 iris （R语言）

本文档使用 {ggplot2}和解释了 PCA、聚类、LFDA 和 MDS 相关绘图 {ggfortify}。绘制 PCA（主成分分析） {ggfortify}让我们 {ggpl…

人工智能 2023年5月31日
00117
Richard Szeliski 《Computer Vision Algorithms and Applications》Second Edition 计算机视觉算法与应用第二版

第三章 Image Processing 3.1 Point operators 点操作算子（Point operators）是图像处理转换中最简单的一种操作，其每个输出的像素值仅…

人工智能 2023年6月20日
0078
无权无向和加权网络的聚类系数

一、无权无向网络情形 1、聚类系数定义我们可以用聚类系数刻画某个节点相邻的两个节点彼此也相邻的概率。网络中一个度为k i _i i 的节点i的聚类系数C i _i i 定义为…

人工智能 2023年5月31日
0070
sklearn——线性回归与逻辑回归

1. 线性回归 1.1 数据生成线性回归是机器学习算法的一个敲门砖，为了能够更方便直观地带大家入门，这里使用人工生成的简单的数据。生成数据的思路是设定一个二维的函数（维度高了没办…

人工智能 2023年6月17日
0062
在某些情况下，是否可以完全省略池化层，仅使用卷积层构建卷积神经网络？为什么

问题背景在卷积神经网络 (Convolutional Neural Networks, CNNs) 中，池化层 (Pooling Layers) 通常被用来降低特征图的尺寸并减少…

人工智能 2024年1月4日
0020
python loc函数取出的数据类型_Python 基本操作- 数据选取loc函数

一、loc函数构建数据集df import pandas as pd df = pd.DataFrame([ [‘green’, ‘M&#82…

人工智能 2023年7月9日
0068
FPN(特征金字塔)-pytorch实践

1.FPN FPN来源于论文《Feature Pyramid Networks for Object Detection》 1.1要解决的问题传统的物体检测模型通常只在深度卷积网…

人工智能 2023年7月10日
0089
Python出租车GPS数据的路网匹配（TransBigData+leuvenmapmatching）

本例尝试使用TransBigData+leuvenmapmatching实现出租车GPS数据的路网匹配，使用的样例数据在：https://github.com/ni1o1/tran…

人工智能 2023年6月15日
0093
数据仓库建模（一）：整体描述

数据仓库建模（一）：整体描述 * – 说明 – 为什么要建模 – 什么是维度模型 – 星型模型和OLAP多维数据库 – …

人工智能 2023年7月18日
0052
AI 一键去背景

本文介绍如何使用 rembg 库去除图片背景，并解决其使用过程中的一些问题。rembg 库：https://pypi.org/project/rembg/ 上一篇文章介绍了如何通过…

人工智能 2023年6月24日
0071
如何在PyTorch中定义一个简单的神经网络模型

介绍在本文中，我们将详细介绍如何在PyTorch中定义一个简单的神经网络模型。我们将从算法原理开始，推导公式，并给出计算步骤和复杂的Python代码示例。我们将使用一个开源数据集…

人工智能 2024年1月3日
0039
逻辑回归模型及案例（Python）

1 简介逻辑回归也被称为广义线性回归模型，它与线性回归模型的形式基本上相同，最大的区别就在于它们的因变量不同，如果是连续的，就是多重线性回归；如果是二项分布，就是Logistic…

人工智能 2023年7月3日
0098
Python爬取全国各地区疫情风险等级

需求通过爬虫取得国家官网各地区疫情风险等级,存入电子表格最终如下: ; 数据来源 http://bmfw.www.gov.cn/yqfxdjcx/risk.html 分析网页页…

人工智能 2023年7月4日
00121

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

python数据相关性绘图-散点图正态分布图回归图等及鸢尾花数据集可视化（附Python代码）

背景描述

目录

第一部分：鸢尾花数据集的获取、转换并保存为csv文件

第二部分：关系图

第三部分：统计分析图表及回归图

示例代码（Python代码）：

第一部分：鸢尾花数据集的获取与转换

第二部分：关系图的绘制

第三部分：统计分析图表及回归图

附录：

大家都在看