掘金后端 ( ) • 2024-04-16 15:50

信号量（semaphore）：解决并发问题的有力工具

记得操作系统课程中，导师曾提出一个引人深思的观点：“信号量几乎可以应对所有的并发问题。”虽然这句话的真实度有待商榷，但不可否认的是，信号量为我们提供了一种更为灵活的方式来处理并发控制难题。

抽象数据类型

想象一下现实世界中的交通信号灯作为信号量 sem，当 C 车辆欲通过路口执行 P() 操作时，若 sem 小于零，则车辆需等待；只有在 A 车或 B 车完成路口通行并执行 V() 操作后，sem 值加 1，C 车才能接收到信号继续前行。

在这里插入图片描述

信号量(sem)使用一个整型来表示，有两个原子操作，P操作和V操作：

P()操作：sem - 1，如果sem < 0则当前线程等待且释放占有资源，否则继续。这里我们可以理解为Java中wait()方法。

V()操作：sem + 1，如果sem <= 0唤醒一个等待的P，进入临界区。这里我们可以理解为Java中notify()方法。

信号量的实现方式

信号量主要分为两类：二进制信号量和计数信号量。

二进制信号量，直观来说，利用 0 和 1 表示信号量的两种状态。
计数信号量，具有大于零的初始值，该值只能通过 P、V 操作递减或递增。初始化时设置为大于零的值，意味着可以允许多个执行 P 操作的线程在满足条件的情况下顺利进入相应的临界区。

二进制信号量的运用

二进制信号量实现互斥：通过给定信号量一个初始值，并确保 P、V 操作配对出现，即可实现在多线程间互斥访问资源。

```伪代码
	// 定义一个mutex信号量且初始值为1
    // 这里初始值设为1，是要使得首次一定会进入临界区
    mutex = new Semaphore(1);
    
    // 进入临界区前执行p()操作，mutex - 1
    mutex -> p();
    
    ···
    // 临界区代码
    ···
    // 退出临界区执行v()操作，mutex + 1
    mutex -> v();

二进制信号量实现同步：在线程 A 必须等待线程 B 达到特定阶段后才可执行时，采用二进制信号量进行同步控制，初始值设为 0，以便 A 线程执行 P 操作时会被挂起等待。

```伪代码
// 创建一个 condition 信号量，初始值为 0
condition = new Semaphore(0);

// 线程 A 执行 p() 操作进入等待状态
Thread A:
    ...
    condition -> p();
    ...

// 线程 B 执行 v() 操作唤醒线程 A
Thread B:
    ...
    condition -> v();
    ...

计数信号量的使用

面对更为复杂的并发场景，计数信号量展现出了其独特的优势。

计数信号量实现互斥与同步

考虑经典的生产者-消费者问题，假设存在一个共享缓冲区，生产者向其中填充数据，消费者从中取出数据，系统需满足以下条件：

同一时刻只有一个线程能操作缓冲区（互斥）；
缓冲区为空时，消费者需等待生产者（同步）；
缓冲区满时，生产者需等待消费者（同步）。

为此，我们定义三个信号量来保证这些约束得以满足：

二进制信号量，负责实现线程间的互斥；
计数信号量 emptyBuffer，记录缓冲区为空的情况；
计数信号量 fullBuffer，记录缓冲区满载的情况。

```伪代码
class Buffer{
    // 定义二进制信号量用于缓冲区buffer互斥
    mutex = new Semaphore(1);
    // 定义计数信号量fullBuffer
    // 初始值为表示缓冲区buffer一开始是空的
    fullBuffer = new Semaphore(0);
    // 定义计数信号量emptyBuffer
    // 初始值为缓冲区buffer的最大值，
    emptyBuffer = new Semaphore(n);
}

// 生产者生产操作
deposit(c){
    // 计数信号量emptyBuffer，检查是否已满载（0表示满载）
    // 计数信号量emptyBuffer执行p操作，-1
    // 初始值为n且大于0，表示可重复进入n次或者n个生产者
    emptyBuffer -> p();
    // 二进制信号量mutex执行p操作，检查是否可进入临界区
    mutex -> p();
    ···
    add c to buffer
    ···
    // 二进制信号量mutex执行v操作
    mutex -> v();
    // 计数信号量fullBuffer，告诉消费者取数据
    // 计数信号量fullBuffer执行v操作，+1
    fullBuffer -> v();
}

// 消费者消费操作
remove(c){
    // 计数信号量fullBuffer，检查是否为空，-1
    // 因为fullBuffer的初始值为0，则一开始消费者无法进入缓冲区buffer进行取数据
    fullBuffer -> p();
    // 二进制信号量mutex执行p操作，检查是否可进入临界区
    mutex -> p();
    ···
    add c to buffer
    ···
    // 二进制信号量mutex执行v操作
    mutex -> v();
    // 计数信号量emptyBuffer，告诉生产者生产，+1
    emptyBuffer -> v();
}

关于 P、V 操作顺序的探讨

文中指出，V 操作仅涉及信号量加 1 并唤醒一个线程，所以这里的 V 操作顺序是可以任意交换而不影响程序逻辑的。然而，P 操作的执行顺序则至关重要。例如，在生产者逻辑中，不能随意交换 emptyBuffer -> p() 和 mutex -> p() 的顺序。若交换后，当缓冲区已满时，新来的生产者可能会先获取到互斥锁，然后尝试减少 emptyBuffer 信号量并陷入等待，从而导致持有互斥锁不放，其他线程无法获得锁，进而产生死锁现象。

综上所述，本文详尽地解释了信号量的基本概念和如何在不同的并发场景中应用二进制信号量与计数信号量实现互斥和同步控制，并通过实例剖析了操作顺序对程序正确性的影响，是一篇对信号量原理及实践有着深入解析的文章。通过这样的整理和讲解，希望能帮助读者更好地理解和掌握信号量在解决并发问题方面的强大能力。