掘金后端 ( ) • 2024-06-15 15:47

Java编程基本功大揭秘 | 详解深入分析Java线程池源码和底层原理，掌握实战技巧【1】

theme: vuepress highlight: a11y-dark

文章大纲

在这里插入图片描述

引言

早期的编程实践中，直接使用新线程执行任务虽直观且易实现，但在高并发场景下却面临性能瓶颈。当系统需处理大量短暂并发任务时，频繁创建和销毁线程会导致巨大的开销，降低系统性能，甚至可能因资源过度消耗导致系统崩溃。为解决线程频繁创建和销毁的问题，我们需要高效复用线程的机制。

Java线程池概念及重要性

Java的线程池（Thread Pool）提供了这样的解决方案：预先创建并管理线程组，任务执行时从池中获取线程，任务完成后线程返回池中等待新任务。这种方式显著减少线程创建和销毁，大幅提升系统并发处理能力。

`ThreadPoolExecutor`类的概述

Java中的ThreadPoolExecutor是线程池的核心实现，提供灵活的配置和管理方法。要深入理解其工作原理和使用，可从关键方法入手，逐步探索其实现逻辑。

`ThreadPoolExecutor`类的基本功能和作用

在Java中，ThreadPoolExecutor是线程池框架的核心组件，它允许开发者以高度可配置和灵活的方式管理线程资源。其核心功能是为应用程序提供一个线程池，从而优化和控制线程的使用，特别是在处理大量并发任务时。

基本功能

线程管理与复用：ThreadPoolExecutor管理一个线程池，当任务提交给线程池时，线程池会尝试复用已有的线程来执行任务，而不是为每个新任务都创建一个新线程。这大大减少了线程创建和销毁的开销。
任务队列：当线程池中的线程都在忙碌时，新提交的任务会被放置在一个任务队列中等待执行。ThreadPoolExecutor允许你配置这个队列的大小和类型，以适应不同的应用场景。
线程生命周期管理：ThreadPoolExecutor允许你配置线程的生命周期，包括核心线程数、最大线程数、线程空闲时间等。当线程空闲超过指定时间后，多余的线程会被销毁以节省资源。
任务拒绝策略：当任务队列已满且所有线程都在忙碌时，新提交的任务将被拒绝。ThreadPoolExecutor提供了几种内置的任务拒绝策略，同时也允许你自定义拒绝策略。

核心作用

提高性能：通过复用线程，ThreadPoolExecutor显著减少了线程创建和销毁的开销，从而提高了应用程序的性能。
资源管理：ThreadPoolExecutor允许你精细控制线程资源的使用，包括线程的数量、任务的排队策略等，从而更有效地管理系统的资源。
简化并发编程：使用ThreadPoolExecutor，开发者可以更加专注于业务逻辑的实现，而无需过多关注线程的管理和调度。
提供灵活的扩展性：通过调整线程池的配置参数，ThreadPoolExecutor可以适应不同规模和需求的应用程序，提供了很好的扩展性。

`ThreadPoolExecutor`主要构造函数及其参数

继承关系链

在这里插入图片描述

ThreadPoolExecutor 实现了 ExecutorService 接口， ExecutorService 扩展了 Executor 接口。

功能介绍

Executor：这是Java中执行已提交任务的对象的接口，提供了一种将任务与任务执行机制（通常是线程）解耦的方式。
ExecutorService：这是一个扩展了Executor接口的接口，它提供了更全面的生命周期管理（例如关闭、终止）和任务提交机制（例如execute, submit等）。ExecutorService通常用于控制和管理线程，它内部封装了一组线程，使得线程的使用更加简便和安全。
AbstractExecutorService：实际上，Java标准库中没有名为AbstractExecutorService的接口。可能您是想引用一个抽象类，但ExecutorService接口本身通常被具体类（如ThreadPoolExecutor）实现，而不是由抽象类来扩展。在标准库中，有一个AbstractExecutorService类的可能性很低，但如果有这样的类，它可能提供了一些ExecutorService接口的默认实现。
ThreadPoolExecutor：这是一个实现了ExecutorService接口的具体类，它提供了线程池的实现，允许用户配置核心线程数、最大线程数、线程空闲时间、任务队列等参数。ThreadPoolExecutor是线程池框架中最常用的实现之一，它高效地管理线程资源的复用，降低了系统的开销。

ThreadPoolExecutor 构造器

java.uitl.concurrent.ThreadPoolExecutor类是线程池中最核心的一个类，因此如果要透彻地了解Java中的线程池，必须先了解这个类。下面我们来看一下ThreadPoolExecutor类的具体实现源码。

public class ThreadPoolExecutor extends AbstractExecutorService {

public ThreadPoolExecutor(int corePoolSize,int maximumPoolSize,long keepAliveTime,TimeUnit unit,
BlockingQueue<Runnable> workQueue);

public ThreadPoolExecutor(int corePoolSize,int maximumPoolSize,long keepAliveTime,TimeUnit unit,
BlockingQueue<Runnable> workQueue,ThreadFactory threadFactory);

public ThreadPoolExecutor(int corePoolSize,int maximumPoolSize,long keepAliveTime,TimeUnit unit,
BlockingQueue<Runnable> workQueue,RejectedExecutionHandler handler);

public ThreadPoolExecutor(int corePoolSize,int maximumPoolSize,long keepAliveTime,TimeUnit unit,
BlockingQueue<Runnable> workQueue,ThreadFactory threadFactory,RejectedExecutionHandler handler);
...
}

从上面的代码可以得知，ThreadPoolExecutor继承了AbstractExecutorService类，并提供了四个构造器，事实上，通过观察每个构造器的源码具体实现，发现前面三个构造器都是调用的第四个构造器进行的初始化工作。

构造器参数

了解如何配置线程池。这包括设置核心线程数、最大线程数、队列容量等参数。这些参数的选择将直接影响线程池的性能和稳定性。通过合理地配置这些参数，我们可以在保证系统性能的同时，也避免了资源的过度消耗。

构造器中各个参数的含义

在这里插入图片描述

corePoolSize

corePoolSize 是线程池中的一个关键参数，它决定了线程池中的核心线程数量。

在创建线程池后，初始状态下线程池内部并不包含任何线程。线程池会等待任务的到来，并根据需要创建线程来执行任务。除非显式地调用 prestartAllCoreThreads() 或 prestartCoreThread() 方法，线程池才会预先创建核心线程。从这两个方法的名字就可以推断出，它们的目的是在未接收到任务之前就创建指定数量的线程。

在默认情况下，当第一个任务到达时，线程池会创建一个新线程来执行它。随着更多任务的到达，线程池中的线程数量会逐渐增加，直到达到 corePoolSize 所设定的数量。一旦线程池中的线程数量达到这个核心值，后续到达的任务将不再触发新线程的创建。

此时，如果还有新任务到来，线程池会将它们放入一个缓存队列中等待执行。这个队列通常是一个阻塞队列，用于存储待执行的任务。只有当队列满了，或者线程池中的线程数量低于 maximumPoolSize（最大线程池大小）时，线程池才会考虑创建额外的线程来执行任务。

注意：合理配置 corePoolSize，可以平衡线程创建和销毁的开销与任务执行的效率。如果 corePoolSize 设置得太小，可能会导致大量任务在队列中等待，从而增加任务的延迟；如果设置得太大，又可能浪费系统资源，因为不是所有线程都会同时处于忙碌状态。因此，在实际应用中，需要根据任务的特性和系统资源来合理设置这个参数。

maximumPoolSize

线程池中的maximumPoolSize参数指的是线程池能够容纳的最大线程数量。当线程池中的线程数量达到这个值时，新的任务提交到线程池时，线程池将不会再创建新的线程来处理这些任务，而是根据线程池的其他策略（如队列策略）来决定如何处理这些新任务。

keepAliveTime

线程没有任务执行时最多保持多久时间会终止。

默认情况下，只有当线程池中的线程数大于corePoolSize时，keepAliveTime才会起作用，直到线程池中的线程数不大于corePoolSize，即当线程池中的线程数大于corePoolSize时，如果一个线程空闲的时间达到keepAliveTime，则会终止，直到线程池中的线程数不超过corePoolSize。

注意：如果调用了allowCoreThreadTimeOut(boolean)方法，在线程池中的线程数不大于corePoolSize时，keepAliveTime参数也会起作用，直到线程池中的线程数为0；

unit

unit：参数keepAliveTime的时间单位，有7种取值，在TimeUnit类中有7种静态属性：在这里插入图片描述

workQueue

一个阻塞队列，用来存储等待执行的任务，这个参数的选择也很重要，会对线程池的运行过程产生重大影响，一般来说，这里的阻塞队列有以下几种选择：在这里插入图片描述线程池中的阻塞队列（BlockingQueue）是线程池的一个重要组成部分，用于存储待执行的任务。当线程池中的线程数量达到corePoolSize时，新提交的任务会被放入这个队列中等待执行。阻塞队列的类型会影响线程池的行为和性能。以下是您提到的几种阻塞队列的作用和特性：

ArrayBlockingQueue（数组类型队列）
- 特点：基于数组结构的有界阻塞队列。
- 容量限制：在创建时需要指定队列的容量，一旦队列满了，新提交的任务会被拒绝。
- 性能：由于是基于数组，它在入队和出队操作上的时间复杂度是O(1)，具有较好的性能。
- 使用场景：适用于有固定大小的任务缓存场景，当任务量比较大时，能够避免在内存中创建大量的对象。
LinkedBlockingQueue（链表类型队列）
- 特点：基于链表结构的有界（但默认大小为Integer.MAX_VALUE，可视为无界）阻塞队列。
- 容量限制：可以指定队列的容量，但如果不指定，则默认为Integer的最大值，几乎可以认为是无界的。
- 性能：入队和出队操作的时间复杂度为O(1)，但由于是链表结构，实际性能可能会略低于ArrayBlockingQueue。
- 使用场景：适用于任务量较大，但不想或不需要限制队列大小的场景。
SynchronousQueue（同步单元素队列）
- 特点：一个不存储元素的阻塞队列，也就是说它的容量为1。
- 容量限制：只能存储一个元素，如果队列中有元素，则新提交的任务可以直接获取执行，否则需要等待其他线程执行完任务后，腾出空间才能继续。
- 性能：入队和出队操作的时间复杂度接近O(1)，但由于其特殊的特性，线程间的交互更为频繁，可能导致更高的线程调度开销。
- 使用场景：适用于线程池中的线程数量与任务数量大致相等，且任务执行时间较短的场景。
PriorityBlockingQueue（具有优先级的队列）
- 特点：一个支持优先级排序的无界阻塞队列。
- 容量限制：默认是无界的，可以存储任意数量的任务。
- 优先级：队列中的元素按照它们的自然排序或者通过提供的Comparator进行排序，优先级高的任务将优先被执行。
- 性能：由于需要排序，入队和出队操作的时间复杂度可能会高于O(1)。
- 使用场景：适用于需要按照优先级执行任务的场景，例如，某些重要或紧急的任务需要优先得到处理。

ArrayBlockingQueue和PriorityBlockingQueue使用较少，一般使用LinkedBlockingQueue和Synchronous。线程池的排队策略与BlockingQueue有关。

threadFactory

线程工厂，主要用来创建线程的工厂实现类。

public interface ThreadFactory {

    /**
     * Constructs a new {@code Thread}.  Implementations may also initialize
     * priority, name, daemon status, {@code ThreadGroup}, etc.
     *
     * @param r a runnable to be executed by new thread instance
     * @return constructed thread, or {@code null} if the request to
     *         create a thread is rejected
     */
    Thread newThread(Runnable r);
}

handler

表示当拒绝处理任务时的策略，有以下四种取值：在这里插入图片描述

theme: vuepress highlight: a11y-dark

文章大纲

引言

Java线程池概念及重要性

`ThreadPoolExecutor`类的概述

`ThreadPoolExecutor`类的基本功能和作用

基本功能

核心作用