今天是学习的新一天,简单学习完成了Kaggle上的Data Visualization入门课程,简要写一点,方便后续复习。(毕竟要是忘了,也好捡回来)
这里主要利用的是 Python中的 seaborn库
可以通过如下代码导入
import pandas as pd
pd.plotting.register_matplotlib_converters()
import matplotlib.pyplot as plt
import seaborn as sns
print("Setup Complete")
museum_data="../input/museum.csv"
museum_data = pd.read_csv(museum_filepath,index_col="Date",parse_dates = True)
museum_data.head()
museum.data.tail()
默认为五行数据,可在括号内进行数字修改
这边参照Kaggle上的分类,基本分为三类
此函数将列数据随index的变化趋势展示出来。
sns.lineplot(data = museum_data)
展示某一列:
sns.lineplot(data = museum_data['Avita Adobe'],label="Avita Adobe")
此函数以柱状图的形式展示x、y之间的统计关系,会将横坐标的数据合并处理。
sns.barplot(x = ign_data.index,y = ign_data.Racing)
此函数以热力图的形式展示数据之间的统计关系
sns.heatmap(data = ign_data.index,annot = True)
此函数以散点图的形式展示x、y之间的统计关系
sns.scatterplot(
x=candy_data['pricepercent'],
y=candy_data['winpercent'],
hue=candy_data['chocolate']
)
此函数以散点图的形式展示x、y之间的统计关系,并展示拟合后的线性回归直线和置信区间。
sns.regplot(x=candy_data['pricepercent'],y=candy_data['winpercent'])
此函数与 sns.regplot
类似,不过此函数允许使用FacetGrid绘图方式。
sns.lmplot(
x ="pricepercent",
y = "winpercent",
hue = "chocolate",
data = candy_data
)
此函数以分簇散点图的形式展示x、y之间的统计关系。
sns.swarmplot(x=candy_data['pricepercent'],y=candy_data['winpercent'])
sns.displot
绘制所给数据的频率直方图, lde=False
。
此处需要注意,这里的参数为 a
sns.distplot(
a=cancer_b_data['Area (mean)'],
label="Benign",
kde=False
)
sns.distplot(
a=cancer_m_data['Area (mean)'],
label="Malignant",
kde=False
)
plt.legend()
sns.kdeplot
绘制密度的分布曲线
sns.kdeplot(
data=cancer_b_data['Radius (worst)'],
shade=True,
label="Benign"
)
sns.kdeplot(
data=cancer_m_data['Radius (worst)'],
shade=True,
label="Malignant"
)
plt.legend()
sns.kdeplot
绘制2D的kde曲线
sns.jointplot(
x = iris_data['Petal Length (cm)'],
y = iris_data['Sepal Width (cm)'],
kind = "kde"
)
此函数修改图的宽和高
plt.figure(figsize=(4,3))
此函数加标题
plt.title("Daily Global Streams of Popular Songs in 2017-2018")
此函数给x/y轴加标题
plt.xlabel("Date")
打印所有列名字
list(museum_data.columns)
补充:
seaborn有五个不同的主题:
- I.”DarkGrid”
- II.”WhiteGrid”
- III.”Dark”
- IV.”White”
- V.”Ticks”
sns.set_style("Dark")
Original: https://blog.csdn.net/qq_43997707/article/details/122782877
Author: limo_hui
Title: Kaggle Courses-数据可视化学习
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/699204/
转载文章受原作者版权保护。转载请注明原作者出处!