C/C++ 中生成特定范围内的随机数

大家在写 C/C++ 程序时,难免会遇到要求获取某个范围内的随机数,我查阅了一些资料后,总结如下。本文分两部分,先介绍 C 语言中与随机数相关的两个函数 srand 和 rand,后介绍 C++ 中的 random 库,每一部分最后会给出生成特定范围内的随机数模板供参考。


1 C 语言中的 srand 和 rand


1.1 实现

下面是 VC 的实现,GCC 的实现比 VC 的复杂,但基本原理是一样的。
#define RAND_MAX 32767	// in 

unsigned long _Randseed = 1;	// global seed

void srand(unsigned int seed) {
	_Randseed = seed;
}

int rand(void) {
	_Randseed = _Randseed * 1103515245 + 12345;

	return ((unsigned int)(_Randseed >> 16) & RAND_MAX);
}

第一次接触 C 语言中的随机数时,很疑惑为什么有种子这个玩意,只提供一个产生随机数的函数不就行了吗,看了上面的源码后,就明白了,因为计算机不能产生真正的随机数,只能靠数学的方法产生伪随机数。srand 函数的作用是设置种子,如果不设置的话种子(上面的 _Randseed)则默认初始是1,种子是全局变量。rand 的实现就跟数论有关了,上面的实现用的是线性同余法。可以看到它的返回值范围是 [0, RAND_MAX]。


1.2 time

既然计算机不能产生真正的随机数,那怎么才能使程序每次运行的结果不同呢?总得有个随机的东西,那就借助 time 这个函数产生种子,引入一个新东西又会带来一些坑,我早年写过这种程序:

// 生成十个随机数(错误用法)
for (int i = 0; i < 10; ++i) {
	srand((unsigned int)time(NULL));
	printf("%d: %d\n", i, rand());
}
它将产生10个相同的数。要解释这个问题,就得弄懂 time 这个函数,它的函数原型如下:
time_t time(time_t *timer);

它返回“当前时间”,这个“时间“的类型是 time_t,在 VC 中被 typedef 为 unsigned long,标准中只规定它是个算数类型,至于它是如何表示时间的未定义。一般是返回 UNIX 时间戳,定义为从格林威治时间1970年01月01日00时00分00秒起至现在的总秒数。上面的程序执行时很快,在一秒内完成循环,所以它产生了相同的随机数。


1.3 my rand

下面提供两个生成随机数的模板。

int g_is_first = 1;

/*
** return a random integer in the interval
** [a, b]
*/
int uniform_int(int a, int b) {
	if (g_is_first) {
		g_is_first = 0;
		srand((unsigned int)time(NULL));
	}

	return (int)((double)rand() / ((RAND_MAX + 1.0) / (b - a + 1.0)) + a);
}

/*
** return a random real in the interval
** [a, b] (also [a, b))
*/
double uniform_real(double a, double b) {
	if (g_is_first) {
		g_is_first = 0;
		srand((unsigned int)time(NULL));
	}

	return (double)rand() / ((double)RAND_MAX / (b - a)) + a;
}
为了保证 srand 函数只执行一次,这里用了全局标志 g_is_first。其实最好在头文件中定义接口,在源文件中实现,这里为了使用方便就全放一起了。当要求的随机数范围过大时,uniform_int 和 uniform_real 貌似有 bug。


2 C++ 中的 random 库


在 random 库中有随机数发生器(random engine/generator)和分布(distribution),它们的具体用法我就不在这说了。我个人认为 engine 存储了种子,将 C 语言中的全局种子封装起来了。uniform distribution 中只存储了最大值和最小值(即平均分布的两个参数)。还有个真正的 engine 叫 std::random_device,它根据机器的各种实时参数产生随机数,标准规定它的实现是可选的,有的编译器(如 MinGW)目前不支持,产生的还是伪随机数,不过 VC 及 Linux 平台上的 GCC 是支持的,下面的程序假设用户的编译器支持。
/*
** return a random integer in the interval [a, b]
*/
int uniform_int(int a, int b) {
	static std::default_random_engine e{std::random_device{}()}; // avoid "Most vexing parse"
	static std::uniform_int_distribution u;

	return u(e, decltype(u)::param_type(a, b));
}

/*
** return a random real in the interval [a, b] (also [a, b))
*/
double uniform_real(double a, double b) {
	static std::default_random_engine e{std::random_device{}()};
	static std::uniform_real_distribution u;

	return u(e, decltype(u)::param_type(a, b));
}
最后,还有个问题没搞懂:能否始终用 random_device 代替 default_random_engine ?它们的区别是什么?

参考资料

[1] C 标准库
[2] C 和指针
[3] 随机数是骗人的,.Net、Java、C为我作证
[4]  How to generate a random number in C?
[5]  Generate random numbers uniformly over an entire range
[6]  Generate a random number within range?
[7]  C++ random float number generation
[8] C++ Primer
[9]  How to make sure a function is only called once

你可能感兴趣的:(Source,Code,C/C++)