Kaggle Courses-数据可视化学习

今天是学习的新一天,简单学习完成了Kaggle上的Data Visualization入门课程,简要写一点,方便后续复习。(毕竟要是忘了,也好捡回来)

这里主要利用的是 Python中的 seaborn
可以通过如下代码导入

import pandas as pd
pd.plotting.register_matplotlib_converters()
import matplotlib.pyplot as plt
import seaborn as sns
print("Setup Complete")

museum_data="../input/museum.csv"
museum_data = pd.read_csv(museum_filepath,index_col="Date",parse_dates = True)
museum_data.head()
museum.data.tail()

默认为五行数据,可在括号内进行数字修改

这边参照Kaggle上的分类,基本分为三类

此函数将列数据随index的变化趋势展示出来。

sns.lineplot(data = museum_data)

展示某一列:

sns.lineplot(data = museum_data['Avita Adobe'],label="Avita Adobe")

此函数以柱状图的形式展示x、y之间的统计关系,会将横坐标的数据合并处理。

sns.barplot(x = ign_data.index,y = ign_data.Racing)

此函数以热力图的形式展示数据之间的统计关系

sns.heatmap(data = ign_data.index,annot = True)

此函数以散点图的形式展示x、y之间的统计关系

sns.scatterplot(
    x=candy_data['pricepercent'],
    y=candy_data['winpercent'],
    hue=candy_data['chocolate']
    )

此函数以散点图的形式展示x、y之间的统计关系,并展示拟合后的线性回归直线和置信区间。

sns.regplot(x=candy_data['pricepercent'],y=candy_data['winpercent'])

此函数与 sns.regplot类似,不过此函数允许使用FacetGrid绘图方式。

sns.lmplot(
    x ="pricepercent",
    y = "winpercent",
    hue = "chocolate",
    data = candy_data
    )

此函数以分簇散点图的形式展示x、y之间的统计关系。

sns.swarmplot(x=candy_data['pricepercent'],y=candy_data['winpercent'])

sns.displot绘制所给数据的频率直方图, lde=False
此处需要注意,这里的参数为 a

sns.distplot(
    a=cancer_b_data['Area (mean)'],
    label="Benign",
    kde=False
)
sns.distplot(
    a=cancer_m_data['Area (mean)'],
    label="Malignant",
    kde=False
    )
plt.legend()

sns.kdeplot绘制密度的分布曲线

sns.kdeplot(
    data=cancer_b_data['Radius (worst)'],
    shade=True,
    label="Benign"
    )
sns.kdeplot(
    data=cancer_m_data['Radius (worst)'],
    shade=True,
    label="Malignant"
    )
plt.legend()

sns.kdeplot绘制2D的kde曲线

sns.jointplot(
    x = iris_data['Petal Length (cm)'],
    y = iris_data['Sepal Width (cm)'],
    kind = "kde"
    )

此函数修改图的宽和高

plt.figure(figsize=(4,3))

此函数加标题

plt.title("Daily Global Streams of Popular Songs in 2017-2018")

此函数给x/y轴加标题

plt.xlabel("Date")

打印所有列名字

list(museum_data.columns)

补充:

seaborn有五个不同的主题:

  • I.”DarkGrid”
  • II.”WhiteGrid”
  • III.”Dark”
  • IV.”White”
  • V.”Ticks”
sns.set_style("Dark")

Original: https://blog.csdn.net/qq_43997707/article/details/122782877
Author: limo_hui
Title: Kaggle Courses-数据可视化学习

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/699204/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球