(四)R语言的数据可视化——矩阵图、柱状图、饼图、散点图与线性回归、带状图

注:本博客旨在分享个人学习心得,有不规范之处请多多包涵!

目录

Histogram 矩形图

在统计学中,矩形图经常被用作展示某连续变量(如长度、重量等测量数值)的分布。在R语言中构造矩形图用 hist()函数,具体请见下例:


hist(sampleData$length, main = "Histogram of Protein Lengths",
    xlab = "Length (AA)", ylab = "Frequency", freq = TRUE,breaks = 20,
    xlim = c(0,10000), ylim = c(0,7000))

下图为画出的效果:

(四)R语言的数据可视化——矩阵图、柱状图、饼图、散点图与线性回归、带状图
在这张图中,我们可以发现大部分的protein length都在2000以下,是一个很明显的正偏态分布。

Bar plot 柱状图

柱状图在统计学中经常被用作展示非连续变量(如人数、钱数等计数测量)的分布。在R语言中构造柱状图用 barplot()函数,具体请见下例:


barplot(education$spending,
            names.arg = education$year,
            ylab = "Spending per student($)",
            main = "Education Spending per Student",
            ylim=c(0,7000))

下图为画出的效果:

(四)R语言的数据可视化——矩阵图、柱状图、饼图、散点图与线性回归、带状图
可见样本数据中,平均每学生在教育的逐年递增。

Pie chart 饼图

饼图能很直观地展示数据中不同种类的占比。R语言中自带的 pie()函数功能并不是很强大。在R语言中构造饼图请见下例:


percentage  c(36, 8, 17, 52)
desserts  c("Ice cream", "Cookie", "Brownie", "Cake")
pie(percentage, labels = desserts,
        main = "Dessert Preference",
        col = rainbow(length(percentage)),
        clockwise = FALSE, init.angle = 0)

下图为画出的效果:

(四)R语言的数据可视化——矩阵图、柱状图、饼图、散点图与线性回归、带状图

Dot plot 散点图

散点图经常被用在科学实验中,在把自变量和因变量可视化的基础上进行进一步分析。在R语言中构造散点图用 plot()函数,具体请见下例:

a  c(12, 17, 25, 33, 39, 45)
b  c(10, 13, 17, 20, 26, 31)

plot(a, b, main="My Plot", xlab="x variable", ylab="y variable")

abline(lm(b~a), col="red")
summary(lm(b~a))

下图为画出的效果:

(四)R语言的数据可视化——矩阵图、柱状图、饼图、散点图与线性回归、带状图
下图为summary()在Console输出的结果:
(四)R语言的数据可视化——矩阵图、柱状图、饼图、散点图与线性回归、带状图
图中的Estimate下为回归线的截距(2.09396)和斜率(0.61074)。Multiple R-squared就是我们常用的R方值(0.975)。

Box-and-whisker plot 箱形图

箱形图能很好地展示数据的分布情况。R语言中构造箱形图用 boxplot()函数,具体请见下例:


data  c(1, 1, 2, 3, 5, 8, 13, 21, 34)
boxplot(data, horizontal=TRUE)

下图为画出的效果:

(四)R语言的数据可视化——矩阵图、柱状图、饼图、散点图与线性回归、带状图
从左到右看图里竖直的线,我们可以看出数据的下边缘、下四分位数、中位数、上四分位数、上边缘,和圆圈代表的异常值。可以看出这组数据正偏态分布、有异常值等特点。

Strip chart 带状图

带状图类似于一维的散点图,功能接近于箱形图,能在较小的数据量下直观展示数据的分布。R语言中构造带状图用 stripchart()函数,具体请见下例:


data  c(1, 1, 2, 3, 5, 8, 13, 21, 34)
par(mfrow=c(1, 2))
stripchart(data, method = "jitter", jitter=1)
stripchart(data, method = "stack", offset=1)

下图为画出的效果:

(四)R语言的数据可视化——矩阵图、柱状图、饼图、散点图与线性回归、带状图
可以看出,大部分数据在左侧更加紧凑,越向右越分散。

结束语

介绍了这么多种用R语言做数据可视化的方式,做数据分析最重要的还是选择适合数据类型和分析目的的图。有任何问题或想法欢迎留言和评论!

Original: https://blog.csdn.net/EricFrenzy/article/details/119301267
Author: EricFrenzy
Title: (四)R语言的数据可视化——矩阵图、柱状图、饼图、散点图与线性回归、带状图

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/695696/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球