Qingverse - 技术学习与成长记录

`<random>`

C++ 的 <random> 头文件是在 C++11 标准中引入的，目的是为了提供一个现代、灵活且高质量的随机数生成框架，取代传统的 C 标准库中的 rand() 函数

总体概述

目的与优势 <random> 头文件提供了一套独立于平台的随机数生成工具，能够产生符合统计分布要求的随机数

相比传统的 rand()，这种方式具有：

更高的随机性和更长的周期
明确的分布定义（均匀、正态、伯努利等）
更好的可控性和可复现性（可通过固定种子来产生确定的随机序列）
面向对象和模板化设计，极大地提高了灵活性和可扩展性

基本设计思想

随机数生成过程可以拆解为两大部分：

随机数引擎（Engine）：负责产生原始的随机数序列，通常是伪随机数生成器（PRNG）
随机分布（Distribution）：将引擎生成的数字映射到特定的概率分布上，使得输出数值符合预定的数学分布（例如均匀分布、正态分布等）

随机数引擎（Engine）

引擎是整个随机数生成的基础，它们生成的是均匀分布的无符号整数，然后通过分布函数进一步变换

常见的引擎包括：

std::random_device
- 这是一个“真随机”的接口，通常依赖于硬件或者操作系统的随机源来生成非确定性随机数
- 注意：有的系统上可能会退化为伪随机数生成器，因此性能和质量可能有所不同
伪随机数生成器（Pseudo-Random Number Generators, PRNGs）
- std::default_random_engine
  - 定义为某个具体的引擎（通常是实现决定的），方便初学者使用，但不同平台可能有所不同，不推荐用于需要跨平台可重复性实验的场合
- 线性同余引擎（Linear Congruential Engine）
  - 例如 std::minstd_rand 和 std::minstd_rand0，工作原理简单，适合对随机性要求不高且追求速度的场景
- 梅森旋转器引擎（Mersenne Twister）
  - std::mt19937（32 位）和 std::mt19937_64（64 位），具有极长的周期（2^19937−1 或 2^19937−1）和良好的统计特性，是目前最常用的随机引擎之一
- 其他引擎
  - 包括 std::ranlux24_base, std::ranlux48_base, 和 std::knuth_b，这些引擎在统计质量和性能上各有特点，可根据实际需求选择

引擎的使用

大部分引擎都是类模板，其构造函数通常允许传入种子（seed）来初始化随机序列

如果不传入种子，则可能会使用默认值，这可能导致每次运行产生相同的随机序列

例如，通过 std::random_device 获取种子，然后初始化 std::mt19937：

# include <random>
# include <iostream>

int main()
{
    std::random_device rd;    // 获取非确定性随机数种子（如果可用）
    std::mt19937 engine(rd());  // 初始化 Mersenne Twister 引擎
    // 后续通过 engine 生成随机数
    return 0;
}

使用时逻辑示例：

std::random_device rd; //获取随机种子
std::mt19937 gen(rd()); //使用梅森旋转器引擎，生成高质量的随机数
std::uniform_int_distribution<> r(1, 100);  // 定义一个 1 到 100 的整数分布
int randomNum = r(gen); 用一个变量来接收这个随机数

随机分布（Distribution）

随机分布类用于将引擎输出的随机整数映射为符合特定分布的数值

常见的分布有：

均匀分布
- std::uniform_int_distribution：用于生成均匀分布的整数，用户可以指定上下界，例如生成 1 到 6 的整数，模拟骰子点数
- std::uniform_real_distribution：用于生成均匀分布的浮点数，通常在 [0.0, 1.0) 或其他指定范围内
正态分布
- std::normal_distribution：产生符合正态（高斯）分布的随机数，需要指定均值（mean）和标准差（stddev）
伯努利分布
- std::bernoulli_distribution：用于生成服从伯努利分布的布尔值，参数为事件发生的概率
其他分布
- std::exponential_distribution：指数分布
- std::chi_squared_distribution：卡方分布
- std::cauchy_distribution、std::gamma_distribution、std::weibull_distribution 等，每种分布都有特定的参数，使用时需要详细了解数学特性。

分布的使用方式

随机分布对象通常是函数对象，可以接受一个随机数引擎作为参数，返回一个按照特定分布调整后的随机数值

示例代码：

# include <random>
# include <iostream>

int main()
{
    std::random_device rd;
    std::mt19937 engine(rd());
    // 构造一个生成 1 到 6 的均匀整数分布
    std::uniform_int_distribution<> distrib(1, 6);

    for (int i = 0; i < 10; ++i) {
        std::cout << distrib(engine) << " ";
    }
    std::cout << std::endl;
    return 0;
}

引擎与分布的组合使用

随机数生成的标准用法是将一个随机数引擎与一个随机分布相结合：

初始化引擎：选择合适的引擎，根据需要使用 std::random_device 产生种子或手动设定一个固定种子以便结果重现
设定分布：根据应用场景选择合适的概率分布，并根据分布特性设置参数（如范围、均值、标准差等）
生成随机数：调用分布对象，将引擎作为参数传入，返回一个符合分布要求的随机数值

这种设计将生成随机数的过程模块化，使得可以在不改变引擎的情况下更换分布，或者反之，从而实现更高的灵活性和可维护性

其他高级特性和注意事项

状态保存和复制

大多数随机数引擎支持复制和保存状态，这在需要重现随机数序列或进行调试时非常有用

例如，可以将引擎的状态存储到一个流中，然后以后恢复使用：

# include <random>
# include <fstream>
# include <iostream>

int main()
{
    // 创建一个 Mersenne Twister 引擎并通过随机设备初始化
    std::random_device rd;
    std::mt19937 engine(rd());

    // 保存引擎状态到文件
    {
        std::ofstream ofs("engine_state.txt");  // 打开一个输出文件流
        if (!ofs) {
            std::cerr << "无法打开文件来保存状态！\n";
            return 1;
        }
        ofs << engine;  // 将当前 engine 的状态写入文件
    }
    
    // 这里可以进行一些操作，改变 engine 的状态
    std::cout << "随机数: " << engine() << std::endl;
    
    // 从文件中恢复引擎状态
    std::mt19937 restored_engine;
    {
        std::ifstream ifs("engine_state.txt");  // 打开一个输入文件流
        if (!ifs) {
            std::cerr << "无法打开文件来读取状态！\n";
            return 1;
        }
        ifs >> restored_engine;  // 从文件读取状态并写入新 engine
    }
    
    // 现在 restored_engine 的状态与保存时的 engine 状态一致，
    // 如果你继续生成随机数，结果将与从保存状态继续生成的结果相同。
    std::cout << "恢复后第一个随机数: " << restored_engine() << std::endl;
    
    return 0;
}

在这段代码中，大括号 {} 被用来创建局部作用域，目的是限定文件流对象的生命周期。这么做主要有以下几个原因：

确保及时关闭文件

当使用 std::ofstream 或 std::ifstream 打开文件时，这些对象会在其析构函数中自动关闭文件

通过在大括号内创建它们，当作用域结束时，这些对象会被销毁，并自动调用析构函数，从而确保文件被及时关闭

这对避免文件句柄泄露、确保数据完整写入以及后续能够安全读取同一个文件都非常重要

避免资源冲突

在保存状态之后，代码中对 engine 进行了操作（调用 engine() 生成新的随机数），如果文件流对象还处于打开状态，可能会导致文件锁定或资源无法及时释放的问题

同样，在读取状态时，使用局部作用域可以保证文件读取完成后，输入流被销毁，避免了文件访问冲突或资源未释放问题

提高代码的可维护性和清晰度

通过使用局部作用域，代码逻辑更清晰地表达了“在这里打开文件，完成操作后立即关闭文件”的意图

这样不仅能减少错误，还能使代码更容易理解和维护，因为每个资源的生命周期被严格控制在其局部作用域内，而不需要在后面手动调用 close() 方法

总结来说，使用大括号来划分作用域是一种典型的 RAII（资源获取即初始化）技术的应用，它确保了文件流对象在离开作用域时会自动清理资源，从而增强了代码的安全性和健壮性

线程安全性

虽然各个引擎本身没有内置线程安全机制，但在多线程环境中可以为每个线程单独创建一个引擎实例，或者采用额外的同步机制来保证安全

可扩展性与定制化

<random> 提供的分布类型可以满足大部分常见需求；如果内置分布不符合特定需求，可以通过自定义分布类来实现特定的概率分布

引擎和分布都是模板类，这意味着它们可以和用户定义的类型一起使用，只要符合要求

种子问题

使用不当的种子（例如总是使用固定值）会导致每次运行得到相同的随机序列，因此对于需要随机性较强的场合，建议利用 std::random_device 或者系统时间等来源生成种子

同时，为了测试方便，有时会使用固定种子来实现结果可重复，但在生产环境中应谨慎使用

性能考量 不同的随机数引擎在性能和生成随机数质量上各有优劣：

速度：一些简单的线性同余引擎速度较快，但可能统计特性不够理想
统计特性：如梅森旋转器引擎虽然生成慢一些，但具有非常优秀的随机性和周期长度

根据具体应用场景，平衡性能和随机性是很重要的决策点

总结

<random> 头文件为 C++ 带来了一个面向对象、模块化和可定制的随机数生成框架

从非确定性种子生成到多种引擎，再到丰富的概率分布类型，这个库能够满足从简单游戏模拟到复杂统计模拟的各种需求

使用者可以通过组合不同的引擎和分布，自由地控制随机数生成的行为，获得高质量并且符合预期统计特性的随机数

总体来说，<random> 头文件体现了现代 C++ 对类型安全、模板化设计以及更严格的随机数生成要求，是实现高质量随机算法的重要工具

<random>