掘金 后端 ( ) • 2024-06-15 15:47

theme: vuepress highlight: a11y-dark

文章大纲

在这里插入图片描述

引言

早期的编程实践中,直接使用新线程执行任务虽直观且易实现,但在高并发场景下却面临性能瓶颈。当系统需处理大量短暂并发任务时,频繁创建和销毁线程会导致巨大的开销,降低系统性能,甚至可能因资源过度消耗导致系统崩溃。为解决线程频繁创建和销毁的问题,我们需要高效复用线程的机制。

Java线程池概念及重要性

Java的线程池(Thread Pool)提供了这样的解决方案:预先创建并管理线程组,任务执行时从池中获取线程,任务完成后线程返回池中等待新任务。这种方式显著减少线程创建和销毁,大幅提升系统并发处理能力。


ThreadPoolExecutor类的概述

Java中的ThreadPoolExecutor是线程池的核心实现,提供灵活的配置和管理方法。要深入理解其工作原理和使用,可从关键方法入手,逐步探索其实现逻辑。

ThreadPoolExecutor类的基本功能和作用

在Java中,ThreadPoolExecutor是线程池框架的核心组件,它允许开发者以高度可配置和灵活的方式管理线程资源。其核心功能是为应用程序提供一个线程池,从而优化和控制线程的使用,特别是在处理大量并发任务时。

基本功能

  1. 线程管理与复用ThreadPoolExecutor管理一个线程池,当任务提交给线程池时,线程池会尝试复用已有的线程来执行任务,而不是为每个新任务都创建一个新线程。这大大减少了线程创建和销毁的开销。
  2. 任务队列:当线程池中的线程都在忙碌时,新提交的任务会被放置在一个任务队列中等待执行。ThreadPoolExecutor允许你配置这个队列的大小和类型,以适应不同的应用场景。
  3. 线程生命周期管理ThreadPoolExecutor允许你配置线程的生命周期,包括核心线程数、最大线程数、线程空闲时间等。当线程空闲超过指定时间后,多余的线程会被销毁以节省资源。
  4. 任务拒绝策略:当任务队列已满且所有线程都在忙碌时,新提交的任务将被拒绝。ThreadPoolExecutor提供了几种内置的任务拒绝策略,同时也允许你自定义拒绝策略。

核心作用

  1. 提高性能:通过复用线程,ThreadPoolExecutor显著减少了线程创建和销毁的开销,从而提高了应用程序的性能。
  2. 资源管理ThreadPoolExecutor允许你精细控制线程资源的使用,包括线程的数量、任务的排队策略等,从而更有效地管理系统的资源。
  3. 简化并发编程:使用ThreadPoolExecutor,开发者可以更加专注于业务逻辑的实现,而无需过多关注线程的管理和调度。
  4. 提供灵活的扩展性:通过调整线程池的配置参数,ThreadPoolExecutor可以适应不同规模和需求的应用程序,提供了很好的扩展性。

ThreadPoolExecutor主要构造函数及其参数

继承关系链

在这里插入图片描述

ThreadPoolExecutor 实现了 ExecutorService 接口, ExecutorService 扩展了 Executor 接口。

功能介绍

  • Executor:这是Java中执行已提交任务的对象的接口,提供了一种将任务与任务执行机制(通常是线程)解耦的方式。

  • ExecutorService:这是一个扩展了Executor接口的接口,它提供了更全面的生命周期管理(例如关闭、终止)和任务提交机制(例如execute, submit等)。ExecutorService通常用于控制和管理线程,它内部封装了一组线程,使得线程的使用更加简便和安全。

  • AbstractExecutorService:实际上,Java标准库中没有名为AbstractExecutorService的接口。可能您是想引用一个抽象类,但ExecutorService接口本身通常被具体类(如ThreadPoolExecutor)实现,而不是由抽象类来扩展。在标准库中,有一个AbstractExecutorService类的可能性很低,但如果有这样的类,它可能提供了一些ExecutorService接口的默认实现。

  • ThreadPoolExecutor:这是一个实现了ExecutorService接口的具体类,它提供了线程池的实现,允许用户配置核心线程数、最大线程数、线程空闲时间、任务队列等参数。ThreadPoolExecutor是线程池框架中最常用的实现之一,它高效地管理线程资源的复用,降低了系统的开销。

ThreadPoolExecutor 构造器

java.uitl.concurrent.ThreadPoolExecutor类是线程池中最核心的一个类,因此如果要透彻地了解Java中的线程池,必须先了解这个类。下面我们来看一下ThreadPoolExecutor类的具体实现源码。

public class ThreadPoolExecutor extends AbstractExecutorService {

public ThreadPoolExecutor(int corePoolSize,int maximumPoolSize,long keepAliveTime,TimeUnit unit,
BlockingQueue<Runnable> workQueue);

public ThreadPoolExecutor(int corePoolSize,int maximumPoolSize,long keepAliveTime,TimeUnit unit,
BlockingQueue<Runnable> workQueue,ThreadFactory threadFactory);

public ThreadPoolExecutor(int corePoolSize,int maximumPoolSize,long keepAliveTime,TimeUnit unit,
BlockingQueue<Runnable> workQueue,RejectedExecutionHandler handler);

public ThreadPoolExecutor(int corePoolSize,int maximumPoolSize,long keepAliveTime,TimeUnit unit,
BlockingQueue<Runnable> workQueue,ThreadFactory threadFactory,RejectedExecutionHandler handler);
...
}

从上面的代码可以得知,ThreadPoolExecutor继承了AbstractExecutorService类,并提供了四个构造器,事实上,通过观察每个构造器的源码具体实现,发现前面三个构造器都是调用的第四个构造器进行的初始化工作。

构造器参数

了解如何配置线程池。这包括设置核心线程数、最大线程数、队列容量等参数。这些参数的选择将直接影响线程池的性能和稳定性。通过合理地配置这些参数,我们可以在保证系统性能的同时,也避免了资源的过度消耗。

构造器中各个参数的含义

在这里插入图片描述

corePoolSize

corePoolSize 是线程池中的一个关键参数,它决定了线程池中的核心线程数量。

在创建线程池后,初始状态下线程池内部并不包含任何线程。线程池会等待任务的到来,并根据需要创建线程来执行任务。除非显式地调用 prestartAllCoreThreads()prestartCoreThread() 方法,线程池才会预先创建核心线程。从这两个方法的名字就可以推断出,它们的目的是在未接收到任务之前就创建指定数量的线程。

在默认情况下,当第一个任务到达时,线程池会创建一个新线程来执行它。随着更多任务的到达,线程池中的线程数量会逐渐增加,直到达到 corePoolSize 所设定的数量。一旦线程池中的线程数量达到这个核心值,后续到达的任务将不再触发新线程的创建。

此时,如果还有新任务到来,线程池会将它们放入一个缓存队列中等待执行。这个队列通常是一个阻塞队列,用于存储待执行的任务。只有当队列满了,或者线程池中的线程数量低于 maximumPoolSize(最大线程池大小)时,线程池才会考虑创建额外的线程来执行任务。

注意:合理配置 corePoolSize,可以平衡线程创建和销毁的开销与任务执行的效率。如果 corePoolSize 设置得太小,可能会导致大量任务在队列中等待,从而增加任务的延迟;如果设置得太大,又可能浪费系统资源,因为不是所有线程都会同时处于忙碌状态。因此,在实际应用中,需要根据任务的特性和系统资源来合理设置这个参数。

maximumPoolSize

线程池中的maximumPoolSize参数指的是线程池能够容纳的最大线程数量。当线程池中的线程数量达到这个值时,新的任务提交到线程池时,线程池将不会再创建新的线程来处理这些任务,而是根据线程池的其他策略(如队列策略)来决定如何处理这些新任务。

keepAliveTime

线程没有任务执行时最多保持多久时间会终止。

默认情况下,只有当线程池中的线程数大于corePoolSize时,keepAliveTime才会起作用,直到线程池中的线程数不大于corePoolSize,即当线程池中的线程数大于corePoolSize时,如果一个线程空闲的时间达到keepAliveTime,则会终止,直到线程池中的线程数不超过corePoolSize。

注意:如果调用了allowCoreThreadTimeOut(boolean)方法,在线程池中的线程数不大于corePoolSize时,keepAliveTime参数也会起作用,直到线程池中的线程数为0;

unit

unit:参数keepAliveTime的时间单位,有7种取值,在TimeUnit类中有7种静态属性: 在这里插入图片描述

workQueue

一个阻塞队列,用来存储等待执行的任务,这个参数的选择也很重要,会对线程池的运行过程产生重大影响,一般来说,这里的阻塞队列有以下几种选择: 在这里插入图片描述 线程池中的阻塞队列(BlockingQueue)是线程池的一个重要组成部分,用于存储待执行的任务。当线程池中的线程数量达到corePoolSize时,新提交的任务会被放入这个队列中等待执行。阻塞队列的类型会影响线程池的行为和性能。以下是您提到的几种阻塞队列的作用和特性:

  • ArrayBlockingQueue(数组类型队列)

    • 特点:基于数组结构的有界阻塞队列。
    • 容量限制:在创建时需要指定队列的容量,一旦队列满了,新提交的任务会被拒绝。
    • 性能:由于是基于数组,它在入队和出队操作上的时间复杂度是O(1),具有较好的性能。
    • 使用场景:适用于有固定大小的任务缓存场景,当任务量比较大时,能够避免在内存中创建大量的对象。
  • LinkedBlockingQueue(链表类型队列)

    • 特点:基于链表结构的有界(但默认大小为Integer.MAX_VALUE,可视为无界)阻塞队列。
    • 容量限制:可以指定队列的容量,但如果不指定,则默认为Integer的最大值,几乎可以认为是无界的。
    • 性能:入队和出队操作的时间复杂度为O(1),但由于是链表结构,实际性能可能会略低于ArrayBlockingQueue。
    • 使用场景:适用于任务量较大,但不想或不需要限制队列大小的场景。
  • SynchronousQueue(同步单元素队列)

    • 特点:一个不存储元素的阻塞队列,也就是说它的容量为1。
    • 容量限制:只能存储一个元素,如果队列中有元素,则新提交的任务可以直接获取执行,否则需要等待其他线程执行完任务后,腾出空间才能继续。
    • 性能:入队和出队操作的时间复杂度接近O(1),但由于其特殊的特性,线程间的交互更为频繁,可能导致更高的线程调度开销。
    • 使用场景:适用于线程池中的线程数量与任务数量大致相等,且任务执行时间较短的场景。
  • PriorityBlockingQueue(具有优先级的队列)

    • 特点:一个支持优先级排序的无界阻塞队列。
    • 容量限制:默认是无界的,可以存储任意数量的任务。
    • 优先级:队列中的元素按照它们的自然排序或者通过提供的Comparator进行排序,优先级高的任务将优先被执行。
    • 性能:由于需要排序,入队和出队操作的时间复杂度可能会高于O(1)。
    • 使用场景:适用于需要按照优先级执行任务的场景,例如,某些重要或紧急的任务需要优先得到处理。

ArrayBlockingQueue和PriorityBlockingQueue使用较少,一般使用LinkedBlockingQueue和Synchronous。线程池的排队策略与BlockingQueue有关。

threadFactory

线程工厂,主要用来创建线程的工厂实现类

public interface ThreadFactory {

    /**
     * Constructs a new {@code Thread}.  Implementations may also initialize
     * priority, name, daemon status, {@code ThreadGroup}, etc.
     *
     * @param r a runnable to be executed by new thread instance
     * @return constructed thread, or {@code null} if the request to
     *         create a thread is rejected
     */
    Thread newThread(Runnable r);
}
handler

表示当拒绝处理任务时的策略,有以下四种取值: 在这里插入图片描述

接口继承关系链

总结与展望