一个线程的打工故事

前言

前几天小强去阿里巴巴面试Java岗,止步于二面。

他和我诉苦自己被虐的多惨多惨,特别是深挖线程和线程池的时候,居然被问到不知道如何作答。

对于他的遭遇,结合他过了一面的那个嘚瑟样,我深表同情(加大力度)!

好了,不开玩笑了,在和小强的面试题中,我选取了几个比较典型的线程和线程池的问题。

Java中的线程和操作系统的线程有什么关系?
调用start方法是如何执行run方法的?
线程池提交任务有哪几种方式?分别有什么区别?
谈谈你对阻塞队列的理解。
常见的线程池有哪些?为什么阿里不允许使用 Executors 去创建线程池?
线程池任务调度的流程大致讲一下。
线程池里面的线程执行异常了会怎么样?
核心线程和非核心线程是如何区分的?

想要答对这些问题,并不是很难,但是想要答好,我觉得是非常考验个人功底的。

为了弄清这些问题,我连夜加急,采访了”线程”,下面是线程的自述。

我是谁

我是一个线程,一个底层的打工人。

总有人把我和进程搞混,但其实我和进程的区别很大。

进程是程序的一次执行,CPU的资源都是分发给进程而不是分发给我们线程,进程是资源分配的最小单位,一个进程可以包含很多向我这样的线程。

我们线程是CPU调度执行的最小单位,真正的打工人。

Java中的线程

在Java里面,我的名字叫做java.lang.Thread。

需要注意的是,调用run方法和执行一个普通方法没有区别。想要真正的创建一个线程并启动,需要调用我的start方法。

有一点我必须告诉你,就是我也是有小弟的。

在JVM里面,我有一个JavaThread的小弟,他帮我联系操作系统的osthread线程。

调用我的start方法之后,具体的执行流程是这样的:

当然了,这个过程省略了很多细节,不过很明确的是,我和内核线程是一一对应的。

调度我就相当于调度内核线程,而调度内核线程需要在用户态和内核态之间切换,这个过程开销是非常大的。

所以,创建我成本是很高的,一定要慎重。

线程池

和你们人类一样,我也有着精彩的一生,也会经历出生(创建)、奋斗(Running)、死亡(销毁)等过程,今天我主要和你讲述的是我打工奋斗的生活。

原来我是打零工的,有人需要我的时候就创建一个我,等我完成工作就把我销毁。

上面也提到过,我和内核线程是一对一的,创建和销毁的过程是非常消耗资源的,所以这样的成本非常高。

于是,有人就想了一个办法,开了一个公司,也就是你们说的线程池。

线程池公司统一管理调度我们线程。我们在线程池里面重复着 等待工作——完成工作的步骤。

这样我就可以日复一日年复一年的重复打工了,这种提供了减少对象数量从而改善应用所需的对象结构的方式的模式,被你们人类叫做”享元模式”。

线程池公司有很多种,但都离不开这几个主要指标:

  • corePoolSize:公司正式员工人数。
  • maximumPoolSize:正式工+临时工最大数量。
  • keepAliveTime:临时工多久没做事情会被开除。
  • unit:临时工没做事情会被开除的时间单位。
  • workQueue:公司业务接收部门。
  • threadFactory:行政部,负责招聘培训员工的。
  • handler:业务部接收业务到达上限了的处理方式。

阻塞队列

线程池中的workQueue是一个阻塞队列,用于存放线程池未能及时处理执行的任务。

它的存在既解耦了任务的提交与执行,又能起到一个缓冲的作用。

阻塞队列有很多,下面我带你了解一下常见的阻塞队列。

ArrayBlockingQueue

基于数组实现的有界阻塞队列,创建的时候需要指定容量。此类型的队列按照FIFO(先进先出)的规则对元素进行排序。

基于链表实现阻塞队列,默认大小为Integer.MAX_VALUE。按照FIFO(先进先出)的规则对元素进行排序

SynchronousQueue

一个不存储元素的阻塞队列。每一个put操作必须阻塞等待其他线程的take操作,take操作也必须等待其他线程的put操作。

PriorityBlockingQueue

一个基于数组利用堆结构实现优先级效果的无界队列,默认自然序排序,也可以自己实现compareTo方法自定义排序规则。

DelayedWorkQueue

一个实现了优先级队列功能且实现了延迟获取的无界队列,在创建元素时,可以指定多久多久才能在队列中获取当前元素。只有延时期满了后才能从队列中获取元素。

拒绝策略

当任务队列满了之后,如果还有任务提交过来,会触发拒绝策略,常见的拒绝策略有:

  • AbortPolicy:丢弃任务并抛出异常,默认该方式。
  • CallerRunsPolicy:由调用线程自己处理该任务。谁调用,谁处理。

  • DiscardPolicy:丢弃任务,但是不抛出异常。

  • DiscardOldestPolicy:抛弃任务队列中最旧的任务也就是最先加入队列的,再把这个新任务添加进去。先从任务队列中弹出最先加入的任务,空出一个位置,然后再次执行execute方法把任务加入队列。

当然,除了以上这几种拒绝策略,你也可以根据实际的业务场景和业务需求去自定义拒绝策略,只需要实现RejectedExecutionHander接口,自定义里面的rejectedExecution方法。

运行流程

我们每个线程会被包装成Worker,线程池里面有一个HashSet存放Worker。

当有任务提交过来之后:

  1. 首先检测线程池运行状态,如果不是RUNNING,则直接拒绝,线程池要保证在RUNNING的状态下执行任务。
  2. 如果线程池中Worker的数量小于核心线程数,就会去创建一个新的线程,也就是招聘一个正式工让他执行任务。
  3. 如果Worker的数量大于或者等于核心线程数,就会把任务放到阻塞任务队列里面。
  4. 如果任务队列满了还有任务过来,如果临时工名额没有满(workerCount < maximumPoolSize),就去招聘临时工让临时工执行任务。如果临时工名额都满了,触发任务拒绝策略。

总结而言,就是核心线程能干的事情尽量不去创建非核心线程,这是线程池很关键的一点。

有哪些线程池

我有过四段工作经历,每段经历都有着精彩的故事。

SingleThreadExecutor

SingleThreadExecutor是我加入的第一家线程池,这是一家创业公司,整个线程池就只有我一个线程。

所有的任务都由我干,而且任务队列是一个无界队列。就是说,打工的线程只有我一个,但是需求任务可以是无限多。

在需求任务很多的时候,经常出现任务处理不过来的情况,导致任务堆积,出现OOM。

但因为所有的活都是我干,没有繁琐的沟通成本,不需要处理线程同步的问题,这算是这种线程池的一个优点吧。

这种线程池适用于并发量不大且需要任务顺序执行的场景。

FixedThreadPool

后来公司倒闭了,我又加入了一个叫FixedThreadPool的线程池。

FixedThreadPool和SingleThreadExecutor唯一不同的地方就是核心线程的数量,FixedThreadPool可以招收很多的打工线程。

在这里,我不再是孤军奋斗了,我有了一群共同打拼的小伙伴,大家一起完成任务,一起承担压力。

可这种线程池还是存在一个问题——任务队列是无界的,需求任务过多的话,还是会造成OOM。

这种线程池线程数固定,且不被回收,线程与线程池的生命周期同步的线程池,适用于任务量比较固定但耗时长的任务。

CachedThreadPool

后来,为了离家更近,我离职了。加入了一家叫CachedThreadPool的线程池,进去之后,却发现这是一家外包公司。

这种线程池里面没有一个核心线程(正式工),一有需求就去招聘一个非核心线程(临时工)。

如果一个线程任务干完了之后,60秒之后没有新的任务就会被辞退。

这种线程池的任务队列采用的是SynchronousQueue,这个队列是无法插入任务的,一有任务就创建一个线程执行,如果并发高且任务耗时长,创建太多线程也是可能导致OOM的。所以CachedThreadPool比较适合任务量大但耗时少的任务。

ScheduleThreadPool

经历了外面的风风雨雨,我觉得还是找份固定的工作比较可靠,于是我加入了一家叫做ScheduleThreadPool的国企。

在这里,工作比较的轻松,多数情况下,我只需要在固定的时间干固定的活。

任务忙不过来的时候,公司也会招聘一些临时工帮忙处理,临时工干完活就会被辞退。

综合来说,这类线程池适用于执行定时任务和具体固定周期的重复任务。由于采用的任务队列是DelayedWorkQueue无界队列,所以也是有OOM的风险的。

总结

好了,关于线程的故事就告一段落了。关于线程池的应用实践,我们下次再聊。

文章开头的面试题在大部分在文中都能找到答案,对于没有提到的,这里做一个补充:

1. 线程池提交任务有哪几种方式?分别有什么区别?

有execute和submit两种方式

  • execute只能提交Runnable类型的任务,无返回值。submit既可以提交Runnable类型的任务,也可以提交Callable类型的任务,会有一个类型为Future的返回值,但当任务类型为Runnable时,返回值为null。
  • execute在执行任务时,如果遇到异常会直接抛出,而submit不会直接抛出,只有在使用Future的get方法获取返回值时,才会抛出异常。

2. 线程池里面的线程执行异常了会怎么样?

如果一个线程执行任务的过程中出现异常,那么这个线程对应的Worker会被移出线程池,该线程也会被销毁回收。

同时会通过指定的线程工厂创建一个线程,并封装成Worker放入线程池代替移除的Worker。

3. 核心线程能被回收吗?

核心线程默认不会被回收。但是可以调用allowCoreThreadTimeOut让核心线程可以被回收。

需要注意的是,调用这个方法的线程池必须将keepAliveTime设置为大于0,否则会抛出异常。

4. 核心线程和非核心线程是如何区分的?

核心线程和非核心线程是一个抽象概念,只是用于更好的表述线程池的运行逻辑,实际上都对应操作系统的osThread,都是重量级线程。

在新增Worker的时候,通过一个boolean表达是核心线程还是非核心线程,本质上两者没有什么不同。

5. 为什么阿里不允许使用 Executors 去创建线程池?

FixedThreadPool 和 SingleThreadPool:允许的请求队列长度为 Integer.MAX_VALUE,可能会堆积大量的请求,从而导致 OOM。

CachedThreadPool:允许的创建线程数量为 Integer.MAX_VALUE,可能会创建大量的线程,从而导致 OOM。

总结来说就是,使用Executors创建线程池会容易忽视线程池的一些属性,使用不当容易引起资源耗尽。

写在最后

这个世界上或许没有线程,又或许人人都是线程。

好了,今天的文章就到这里了。

最后,感谢你的阅读!

我是CoderW,一个普通的程序员。

点个关注,我们下期再见!

参考文章

Original: https://www.cnblogs.com/coderw/p/14358493.html
Author: CoderW喜欢写博客
Title: 一个线程的打工故事

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/622707/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

  • Redis锁相关

    Redis锁相关 君不见,高堂明镜悲白发,朝如青丝暮成雪。 背景:面试的时候被问到有哪些锁,很快脱口而出Volatile、Synchronized和ReentrantLock,也能…

    数据库 2023年6月14日
    075
  • MySQL实战45讲 9

    09 | 普通索引和唯一索引,应该怎么选择? 每个人都有一个唯一的身份证号,而且业务代码已经保证了不会写入两个重复的身份证号。如果市民系统需要按照身份证号查姓名,就会执行类似这样的…

    数据库 2023年5月24日
    0105
  • 🤺全套MySQL数据库教程_Mysql基础入门教程,零基础小白自学MySQL数据库必备教程👾#001 # 第一单元 数据库概述 #

    二、本单元知识点概述 (Ⅰ)知识点概述 二、本单元目标 (Ⅰ)重点知识目标 1.什么是数据库2.市面上常见的数据库有哪些3.SQL和数据库的关系 (Ⅱ)能力目标 1.熟练安装MyS…

    数据库 2023年5月24日
    0109
  • 2_CSS

    1. 什么是CSS 1.1 什么是CSS Cascading Style Sheet 层叠样式表 是一种用来表现HTML(标准通用标记语言的一个应用)或XML(标准通用标记语言的一…

    数据库 2023年6月11日
    052
  • Nginx 配置参数优化

    nginx 配置参数优化 nginx作为高性能web服务器,即使不特意调整配置参数也可以处理大量的并发请求。以下的配置参数是借鉴网上的一些调优参数,仅作为参考,不见得适于你的线上业…

    数据库 2023年6月6日
    089
  • 字节一面:事务还没提交的时候,redolog 能不能被持久化到磁盘呢?

    又是被自己菜醒的一天,总结面经看到这题目听都没听过,打开百度就像吃饭一样自然 老规矩,背诵版在文末。点击阅读原文可以直达我收录整理的各大厂面试真题 首先,咱需要明白的是,啥是持久化…

    数据库 2023年6月6日
    0121
  • DRF补充数据库异常和Redis异常

    DRF补充数据库异常和Redis异常 (1)在项目适当位置新建exceptions.py,内容如下: from rest_framework.views import except…

    数据库 2023年6月14日
    059
  • liquibase新增字段注释导致表格注释同时变更bug记录

    liquibase是一个用于数据库变更跟踪、版本管理和自动部署的开源工具。它的使用方式方法可以参考官方文档或者其他人的博客,这里不做过多介绍。 1. 问题复现 在使用过程中发现了一…

    数据库 2023年6月14日
    0109
  • Qt 保持窗口顶层显示最简单方法

    情景: 当前存在两个窗口或以上,先初始化的窗口会被后初始化的窗口覆盖,从而置于底层, 这时一个最简单的方案就是给需要置于顶层的窗口配置事件过滤器,监听窗口状态,当窗口不属于顶层窗口…

    数据库 2023年6月16日
    0119
  • linux中如何查找一个文件夹的大小呢?

    1、(方法一)ls -lht会列出当前目录下每个文件的大小,同时也会给出当前目录下所有文件大小总和 2、(方法二)du -sh *也会列出当前文件夹下所有文件对应的大小 【把*替换…

    数据库 2023年6月11日
    094
  • StoneDB社区答疑第一期

    当然,目前 StoneDB 的社区建设还正处于初启阶段,我们坚信,开源项目的成长,最终还是要靠社区用户一起来共创,因此,StoneDB 开源社区非常重视社区用户的声音,在 7 月份…

    数据库 2023年5月24日
    092
  • web监听器解析

    监听器是web三大组件之一,事件监听机制如下: 事件:某个事件,如果初始化上下文 事件源:事件发生的地方 监听器:一个对象,拥有需要执行的逻辑 注册监听:将事件、事件源、监听器绑定…

    数据库 2023年6月16日
    079
  • Word书签替换,加盖电子印章及转换PDF(Java实用版)

    一、前言 在项目中有需要对word进行操作的,可以看看哈,本次使用比较强大的spire组件来对word进行操作,免费版支持三页哦,对于不止三页的word文件,可以购买收费版,官网:…

    数据库 2023年6月16日
    084
  • Redis安装

    Redis For Windows 安装 Redis 官方只提供源码包,不支持Windows 老版本 Windows 版本下载地址(最高版本为3)老版本地址 新版本 Windows…

    数据库 2023年6月6日
    091
  • 2010最危险的编程错误(转)

    网络无处不在的今天,安全问题日益严峻,攻击事件层出不穷,应该说,软件系统中代码存在安全漏洞是主要的祸因之一。而这实际上反映了软件开发人员在编程的安全性方面缺乏必要的培训和常识。 由…

    数据库 2023年6月11日
    096
  • VMware下的centOS安装与异常记录

    VMware下的centOS安装与异常记录 随笔 记录在使用虚拟机安装centOs的过程中遇到的一些坑,记录一下,之前发在C**N上的,现在决定在这里重新整理一下,加上一些细节的补…

    数据库 2023年6月6日
    0110
亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球