赖亦无

【算法】04 离散分布不放回抽样

问题需求

在用C++实现SCE-UA算法的CCE部分时，遇到这样一个具体问题：
对一个具有离散分布的总体进行不放回抽样，比如有一个总体个数为24的数组{1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24}，各位的概率分别为{48, 46, 44, 42, 40, 38, 36, 34, 32, 30, 28, 26, 24, 22, 20, 18, 16, 14, 12, 10, 8, 6, 4, 2}，换算成小数为{0.08,0.076667,0.073333,0.07,0.066667,0.063333,0.06,0.056667,0.053333,0.05,0.046667,0.043333,0.04,0.036667,0.033333,0.03,0.026667,0.023333,0.02,0.016667,0.013333,0.01,0.006667,0.003333}，权重总和为1，从中不放回地抽取10个数，要求每个数字都按照离散分布所具有的概率抽取。

解题思路

在C++实现过程中，直接对数组进行抽样可能比较困难，因此可以对这个数组的下标0-23共24个连续整数进行抽样，每个下标所具有的概率与实际对应的数的概率相同。路径E:\Master\study\Cpp\RandomSample

失败尝试

包含头文件 #include ，用到其中的std::sample从总体中抽样。但是只能均匀抽样，而不能按照指定的权重抽样，即无法把离散分布dist放入到sample中作为参数，因此采用这种方法是行不通的。
测试代码：

#include 
#include 
#include 
#include 
#include 
#include 

int main()
{
	//随机数引擎采用设备熵值保证随机性
	auto gen = std::mt19937{ std::random_device{}() };

	std::vector<int> wts(24); //存储权重值

	std::vector<int> in(24);  //存储总体

	std::vector<int> out;  //存储抽样结果

	std::map<int, int> count;  //输出计数

	int sampleSize = 10;  //抽取样本的数量

	int sampleTimes = 10000;  //抽取样本的次数

	//权重赋值
	for (int i = 0; i < 24; i++)
	{
		wts.at(i) = 48 - 2 * i;
	}

	//总体赋值
	for (int i = 0; i < 24; i++)
	{
		in.at(i) = i + 1;
	}


	//产生按照给定权重的离散分布
	std::discrete_distribution<size_t> dist{ std::begin(wts), std::end(wts) };

	auto probs = dist.probabilities(); // 返回概率计算结果

	//输出概率计算结果
	std::copy(probs.begin(), probs.end(), std::ostream_iterator<double>
	{ std::cout << std::fixed << std::setprecision(5), " "});

	std::cout << std::endl;

	//抽样测试
	for (size_t j = 0; j < sampleTimes; j++)
	{
		//测试sample函数
		std::sample(in.begin(), in.end(), std::back_inserter(out), sampleSize, gen);

		for (size_t i = 0; i < sampleSize; i++)
		{
			//std::cout << out.at(i) << " ";  //输出抽样结果

			count[out.at(i)] += 1;  //抽样结果计数
		}

		out.clear(); //清空输出数组，为下次抽样做准备
	}

	double sum = 0.0;  //用于概率求和

	//输出抽样结果
	for (size_t i = 1; i <= 24; i++)
	{
		std::cout << i << "共有" << count[i] << "个   频率为：" << count[i] / double(sampleTimes * sampleSize) << std::endl;

		sum += count[i] / double(sampleTimes * sampleSize);
	}

	std::cout << "总频率为：" << sum << std::endl;  //输出总概率

	std::cin.get();  //保留控制台窗口
	return 0;
}

输出结果：

0.08000 0.07667 0.07333 0.07000 0.06667 0.06333 0.06000 0.05667 0.05333 0.05000 0.04667 0.04333 0.04000 0.03667 0.03333 0.03000 0.02667 0.02333 0.02000 0.01667 0.01333 0.01000 0.00667 0.00333
1共有4147个   频率为：0.04147
2共有4169个   频率为：0.04169
3共有4147个   频率为：0.04147
4共有4157个   频率为：0.04157
5共有4152个   频率为：0.04152
6共有4161个   频率为：0.04161
7共有4158个   频率为：0.04158
8共有4184个   频率为：0.04184
9共有4046个   频率为：0.04046
10共有4087个   频率为：0.04087
11共有4174个   频率为：0.04174
12共有4074个   频率为：0.04074
13共有4197个   频率为：0.04197
14共有4196个   频率为：0.04196
15共有4221个   频率为：0.04221
16共有4188个   频率为：0.04188
17共有4234个   频率为：0.04234
18共有4250个   频率为：0.04250
19共有4185个   频率为：0.04185
20共有4207个   频率为：0.04207
21共有4210个   频率为：0.04210
22共有4195个   频率为：0.04195
23共有4131个   频率为：0.04131
24共有4130个   频率为：0.04130
总频率为：1.00000

原始方案

需要包含头文件#include ，用到其中的std::discrete_distribution产生离散分布上的随机整数。每次仅从离散分布中抽取一个数字，放入集合set中，利用集合无重复和有序的特点，循环抽取直至样本数达到要求。
测试代码：

#include 
#include 
#include 
#include 
#include 
#include 


int main()
{
	//随机数引擎采用默认引擎
	std::default_random_engine rng;

	//随机数引擎采用设备熵值保证随机性
	auto gen = std::mt19937{ std::random_device{}() };

	std::vector<int> wts(24); //存储权重值

	std::vector<int> in(24);  //存储总体

	std::set<int> out;  //存储抽样结果

	std::map<int, int> count;  //输出计数

	int sampleCount = 0;  //抽样次数计数

	int index = 0;  //抽取的下标

	int sampleSize = 24;  //抽取样本的数量

	int sampleTimes = 100000;  //抽取样本的次数

	//权重赋值
	for (int i = 0; i < 24; i++)
	{
		wts.at(i) = 48 - 2 * i;
	}

	//总体赋值并输出
	std::cout << "总体为24个：" << std::endl;
	
	//赋值
	for (int i = 0; i < 24; i++)
	{
		in.at(i) = i + 1;

		std::cout << in.at(i) << " ";
	}

	std::cout << std::endl;

	//产生按照给定权重的离散分布
	std::discrete_distribution<size_t> dist{ std::begin(wts), std::end(wts) };	

	auto probs = dist.probabilities(); // 返回概率计算结果

	//输出概率计算结果
	std::cout << "总体中各数据的权重为：" << std::endl;

	std::copy(probs.begin(), probs.end(), std::ostream_iterator<double>
	{ std::cout << std::fixed << std::setprecision(5), " "});
	
	std::cout << std::endl << std::endl;

	//==========抽样测试==========
	for (size_t j = 0; j < sampleTimes; j++)
	{
		index = dist(gen);

		//std::cout << index << " ";  //输出抽样结果

		count[index] += 1;  //抽样结果计数		
	}

	double sum = 0.0;  //用于概率求和

	//输出抽样结果
	std::cout << "总共抽样" << sampleTimes << "次，" << "各下标的频数及频率为：" << std::endl;

	for (size_t i = 0; i < 24; i++)
	{
		std::cout << i << "共有" << count[i] << "个   频率为：" << count[i] / double(sampleTimes) << std::endl;

		sum += count[i] / double(sampleTimes);
	}

	std::cout << "总频率为：" << sum << std::endl << std::endl;  //输出总概率
	//==========抽样测试==========

	//从总体中抽样放入集合中，直至集合大小达到样本数
	while (out.size() < sampleSize)
	{
		index = dist(gen);

		out.insert(index);

		sampleCount += 1;
	}

	//输出抽样结果
	std::cout << "从总体中抽取的" << sampleSize <<"个样本的下标索引为：" << std::endl;

	for (auto iter : out)
	{
		std::cout << iter << " ";
	}

	std::cout << std::endl;

	//输出抽样次数
	std::cout << "抽样次数为：" << sampleCount << std::endl;

	out.clear(); //清空输出集合，为下次抽样做准备

	std::cin.get(); //保留控制台窗口
	return 0;
}

输出结果：

总体为24个：
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
总体中各数据的权重为：
0.08000 0.07667 0.07333 0.07000 0.06667 0.06333 0.06000 0.05667 0.05333 0.05000 0.04667 0.04333 0.04000 0.03667 0.03333 0.03000 0.02667 0.02333 0.02000 0.01667 0.01333 0.01000 0.00667 0.00333

总共抽样100000次，各下标的频数及频率为：
0共有7935个   频率为：0.07935
1共有7674个   频率为：0.07674
2共有7355个   频率为：0.07355
3共有6931个   频率为：0.06931
4共有6596个   频率为：0.06596
5共有6386个   频率为：0.06386
6共有6002个   频率为：0.06002
7共有5691个   频率为：0.05691
8共有5375个   频率为：0.05375
9共有4963个   频率为：0.04963
10共有4747个   频率为：0.04747
11共有4314个   频率为：0.04314
12共有3908个   频率为：0.03908
13共有3770个   频率为：0.03770
14共有3370个   频率为：0.03370
15共有3026个   频率为：0.03026
16共有2706个   频率为：0.02706
17共有2319个   频率为：0.02319
18共有1989个   频率为：0.01989
19共有1680个   频率为：0.01680
20共有1285个   频率为：0.01285
21共有981个   频率为：0.00981
22共有668个   频率为：0.00668
23共有329个   频率为：0.00329
总频率为：1.00000

从总体中抽取的24个样本的下标索引为：
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23
抽样次数为：264

可以看到，为了抽取24个样本，竟然对总体抽样了264次才完成抽取，这效率无疑是极低的。

改进方案

在完成每次抽取后，将抽到的下标索引的权重设置为0，保证不会再被抽取到，这样就保证抽取次数就和样本数相同了。要注意把最后一次抽取单独出来，是避免样本数等于总体的情况下，最后一次抽取后将所有权重都为0的权重数组赋值给离散分布dist，产生错误。考虑到样本等于总体的情况较少，因此没有在之前加一个样本是否等于总体的判断，而是把最后一次抽取单独在循环外执行，提高执行效率，避免判断带来的开销。
测试代码：

//STL改进方案
#include 
#include 
#include 
#include 
#include 
#include 

int main()
{
	//随机数引擎采用默认引擎
	std::default_random_engine rng;

	//随机数引擎采用设备熵值保证随机性
	auto gen = std::mt19937{ std::random_device{}() };

	std::vector<int> wts(24); //存储权重值

	std::vector<int> in(24);  //存储总体

	std::set<int> out;  //存储抽样结果

	std::map<int, int> count;  //输出计数

	int sampleCount = 0;  //抽样次数计数

	int index = 0;  //抽取的下标

	int sampleSize = 24;  //抽取样本的数量

	int sampleTimes = 100000;  //抽取样本的次数

	//权重赋值
	for (int i = 0; i < 24; i++)
	{
		wts.at(i) = 48 - 2 * i;
	}

	//总体赋值并输出
	std::cout << "总体为24个：" << std::endl;

	//赋值
	for (int i = 0; i < 24; i++)
	{
		in.at(i) = i + 1;

		std::cout << in.at(i) << " ";
	}

	std::cout << std::endl;

	//产生按照给定权重的离散分布
	std::discrete_distribution<size_t> dist{ wts.begin(), wts.end() };

	auto probs = dist.probabilities(); // 返回概率计算结果

	//输出概率计算结果
	std::cout << "总体中各数据的权重为：" << std::endl;

	std::copy(probs.begin(), probs.end(), std::ostream_iterator<double>
	{ std::cout << std::fixed << std::setprecision(5), " "});

	std::cout << std::endl << std::endl;

	//==========抽样测试==========
	for (size_t j = 0; j < sampleTimes; j++)
	{
		index = dist(gen);

		//std::cout << index << " ";  //输出抽样结果

		count[index] += 1;  //抽样结果计数		
	}

	double sum = 0.0;  //用于概率求和

	//输出抽样结果
	std::cout << "总共抽样" << sampleTimes << "次，" << "各下标的频数及频率为：" << std::endl;

	for (size_t i = 0; i < 24; i++)
	{
		std::cout << i << "共有" << count[i] << "个   频率为：" << count[i] / double(sampleTimes) << std::endl;

		sum += count[i] / double(sampleTimes);
	}

	std::cout << "总频率为：" << sum << std::endl << std::endl;  //输出总概率
	//==========抽样测试==========

	//从总体中抽样放入集合中，直至集合大小达到样本数
	while (out.size() < sampleSize - 1)
	{
		index = dist(gen);  //抽取下标

		out.insert(index);  //插入集合

		sampleCount += 1;   //抽样次数增加1

		wts.at(index) = 0; //将抽取到的下标索引的权重设置为0
		
		dist.param({ wts.begin(), wts.end() });

		probs = dist.probabilities(); // 返回概率计算结果

        //输出概率计算结果
		std::cout << "总体中各数据的权重为：" << std::endl;

		std::copy(probs.begin(), probs.end(), std::ostream_iterator<double>
		{ std::cout << std::fixed << std::setprecision(5), " "});

		std::cout << std::endl << std::endl;
	}
	//最后一次抽取，单独出来是避免将所有权重都为0的权重数组赋值给离散分布dist，避免报错
	index = dist(gen);  //抽取下标

	out.insert(index);  //插入集合

	sampleCount += 1;   //抽样次数增加1

	//输出抽样结果
	std::cout << "从总体中抽取的" << sampleSize << "个样本的下标索引为：" << std::endl;

	for (auto iter : out)
	{
		std::cout << iter << " ";
	}

	std::cout << std::endl;

	//输出抽样次数
	std::cout << "抽样次数为：" << sampleCount << std::endl;

	out.clear(); //清空输出集合，为下次抽样做准备

	std::cin.get(); //保留控制台窗口
	return 0;
}

运行结果：

总体为24个：
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
总体中各数据的权重为：
0.08000 0.07667 0.07333 0.07000 0.06667 0.06333 0.06000 0.05667 0.05333 0.05000 0.04667 0.04333 0.04000 0.03667 0.03333 0.03000 0.02667 0.02333 0.02000 0.01667 0.01333 0.01000 0.00667 0.00333

总共抽样100000次，各下标的频数及频率为：
0共有8069个   频率为：0.08069
1共有7804个   频率为：0.07804
2共有7379个   频率为：0.07379
3共有6965个   频率为：0.06965
4共有6705个   频率为：0.06705
5共有6389个   频率为：0.06389
6共有5852个   频率为：0.05852
7共有5679个   频率为：0.05679
8共有5394个   频率为：0.05394
9共有5040个   频率为：0.05040
10共有4600个   频率为：0.04600
11共有4247个   频率为：0.04247
12共有3937个   频率为：0.03937
13共有3618个   频率为：0.03618
14共有3350个   频率为：0.03350
15共有3006个   频率为：0.03006
16共有2706个   频率为：0.02706
17共有2308个   频率为：0.02308
18共有2034个   频率为：0.02034
19共有1658个   频率为：0.01658
20共有1356个   频率为：0.01356
21共有973个   频率为：0.00973
22共有609个   频率为：0.00609
23共有322个   频率为：0.00322
总频率为：1.00000

总体中各数据的权重为：
0.08304 0.07958 0.07612 0.07266 0.06920 0.06574 0.06228 0.05882 0.05536 0.05190 0.04844 0.04498 0.04152 0.00000 0.03460 0.03114 0.02768 0.02422 0.02076 0.01730 0.01384 0.01038 0.00692 0.00346

总体中各数据的权重为：
0.08664 0.08303 0.07942 0.07581 0.07220 0.06859 0.06498 0.06137 0.05776 0.05415 0.05054 0.04693 0.00000 0.00000 0.03610 0.03249 0.02888 0.02527 0.02166 0.01805 0.01444 0.01083 0.00722 0.00361

总体中各数据的权重为：
0.09302 0.08915 0.08527 0.08140 0.07752 0.00000 0.06977 0.06589 0.06202 0.05814 0.05426 0.05039 0.00000 0.00000 0.03876 0.03488 0.03101 0.02713 0.02326 0.01938 0.01550 0.01163 0.00775 0.00388

总体中各数据的权重为：
0.10127 0.09705 0.09283 0.00000 0.08439 0.00000 0.07595 0.07173 0.06751 0.06329 0.05907 0.05485 0.00000 0.00000 0.04219 0.03797 0.03376 0.02954 0.02532 0.02110 0.01688 0.01266 0.00844 0.00422

总体中各数据的权重为：
0.00000 0.10798 0.10329 0.00000 0.09390 0.00000 0.08451 0.07981 0.07512 0.07042 0.06573 0.06103 0.00000 0.00000 0.04695 0.04225 0.03756 0.03286 0.02817 0.02347 0.01878 0.01408 0.00939 0.00469

总体中各数据的权重为：
0.00000 0.11735 0.11224 0.00000 0.10204 0.00000 0.09184 0.00000 0.08163 0.07653 0.07143 0.06633 0.00000 0.00000 0.05102 0.04592 0.04082 0.03571 0.03061 0.02551 0.02041 0.01531 0.01020 0.00510

总体中各数据的权重为：
0.00000 0.12707 0.12155 0.00000 0.11050 0.00000 0.09945 0.00000 0.08840 0.00000 0.07735 0.07182 0.00000 0.00000 0.05525 0.04972 0.04420 0.03867 0.03315 0.02762 0.02210 0.01657 0.01105 0.00552

总体中各数据的权重为：
0.00000 0.13295 0.12717 0.00000 0.11561 0.00000 0.10405 0.00000 0.09249 0.00000 0.08092 0.07514 0.00000 0.00000 0.05780 0.05202 0.00000 0.04046 0.03468 0.02890 0.02312 0.01734 0.01156 0.00578

总体中各数据的权重为：
0.00000 0.00000 0.14667 0.00000 0.13333 0.00000 0.12000 0.00000 0.10667 0.00000 0.09333 0.08667 0.00000 0.00000 0.06667 0.06000 0.00000 0.04667 0.04000 0.03333 0.02667 0.02000 0.01333 0.00667

总体中各数据的权重为：
0.00000 0.00000 0.15278 0.00000 0.13889 0.00000 0.12500 0.00000 0.11111 0.00000 0.09722 0.09028 0.00000 0.00000 0.06944 0.06250 0.00000 0.04861 0.00000 0.03472 0.02778 0.02083 0.01389 0.00694

总体中各数据的权重为：
0.00000 0.00000 0.17460 0.00000 0.15873 0.00000 0.00000 0.00000 0.12698 0.00000 0.11111 0.10317 0.00000 0.00000 0.07937 0.07143 0.00000 0.05556 0.00000 0.03968 0.03175 0.02381 0.01587 0.00794

总体中各数据的权重为：
0.00000 0.00000 0.18182 0.00000 0.16529 0.00000 0.00000 0.00000 0.13223 0.00000 0.11570 0.10744 0.00000 0.00000 0.08264 0.07438 0.00000 0.05785 0.00000 0.00000 0.03306 0.02479 0.01653 0.00826

总体中各数据的权重为：
0.00000 0.00000 0.00000 0.00000 0.20202 0.00000 0.00000 0.00000 0.16162 0.00000 0.14141 0.13131 0.00000 0.00000 0.10101 0.09091 0.00000 0.07071 0.00000 0.00000 0.04040 0.03030 0.02020 0.01010

总体中各数据的权重为：
0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.20253 0.00000 0.17722 0.16456 0.00000 0.00000 0.12658 0.11392 0.00000 0.08861 0.00000 0.00000 0.05063 0.03797 0.02532 0.01266

总体中各数据的权重为：
0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.24242 0.00000 0.21212 0.00000 0.00000 0.00000 0.15152 0.13636 0.00000 0.10606 0.00000 0.00000 0.06061 0.04545 0.03030 0.01515

总体中各数据的权重为：
0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.28000 0.00000 0.00000 0.00000 0.20000 0.18000 0.00000 0.14000 0.00000 0.00000 0.08000 0.06000 0.04000 0.02000

总体中各数据的权重为：
0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.34146 0.00000 0.00000 0.00000 0.24390 0.00000 0.00000 0.17073 0.00000 0.00000 0.09756 0.07317 0.04878 0.02439

总体中各数据的权重为：
0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.37037 0.00000 0.00000 0.25926 0.00000 0.00000 0.14815 0.11111 0.07407 0.03704

总体中各数据的权重为：
0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.50000 0.00000 0.00000 0.00000 0.00000 0.00000 0.20000 0.15000 0.10000 0.05000

总体中各数据的权重为：
0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.58824 0.00000 0.00000 0.00000 0.00000 0.00000 0.23529 0.00000 0.11765 0.05882

总体中各数据的权重为：
0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.57143 0.00000 0.28571 0.14286

总体中各数据的权重为：
0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.66667 0.00000 0.33333 0.00000

总体中各数据的权重为：
0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 1.00000 0.00000 0.00000 0.00000

从总体中抽取的24个样本的下标索引为：
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23
抽样次数为：24

随机扰动方案

参考C++: Sampling from discrete distribution without replacement该问题下Aleph0的回答中Easier answer的代码，实现不放回抽样，该回答参考自Faster weighted sampling without replacement回答，具体原理参考自Weighted random sampling with a reservoir这篇论文。简单来说，是把权重值作为指数，均匀分布随机数作为底相当于给权重增加了均匀随机扰动，按照扰动后的权重值从大到小排序，并扩展到索引，然后根据样本数量从前往后直接取数。
测试代码：

//随机扰动方案
#include 
#include 
#include 
#include 
#include 
#include 

int main() 
{
	//随机数引擎采用默认引擎
	std::default_random_engine rng;

	//随机数引擎采用设备熵值保证随机性
	auto gen = std::mt19937{ std::random_device{}() };

	std::vector<double> wts(24); //存储权重值

	std::vector<int> in(24);  //存储总体

	std::map<int, int> count;  //输出计数

	std::uniform_real_distribution<double> u(0.0, 1.0);  //均匀分布

	std::vector<double> vals;

	std::vector<std::pair<int, double>> valsWithIndices;

	std::vector<size_t> samples;  //样本

	int sampleCount = 0;  //抽样次数计数

	int sampleSize = 24;  //抽取样本的数量

	int sampleTimes = 10000;  //抽取样本的次数

	//权重赋值
	for (int i = 0; i < 24; i++)
	{
		wts.at(i) = 48 - 2 * i;
	}

	//总体赋值并输出
	std::cout << "总体为24个：" << std::endl;

	//赋值
	for (int i = 0; i < 24; i++)
	{
		in.at(i) = i + 1;

		std::cout << in.at(i) << " ";
	}

	std::cout << std::endl << std::endl;


	//==========抽样测试==========
	//每次仅抽取1个下标索引
	for (size_t i = 0; i < sampleTimes; i++)
	{
		//把权重值作为指数，均匀分布随机数作为底
		//相当于给权重增加了均匀随机扰动
		for (auto iter : wts) 
		{
			vals.push_back(std::pow(u(gen), 1. / iter));
		}

		//按照扰动后的权重值从大到小排序，并扩展到索引
		for (size_t iter = 0; iter < vals.size(); iter++) 
		{
			valsWithIndices.emplace_back(iter, vals[iter]);
		}

		std::sort(valsWithIndices.begin(), valsWithIndices.end(), [](auto x, auto y) {return x.second > y.second; });
		
		//样本大小sampleSize设置为1
		samples.push_back(valsWithIndices[0].first);
		
		//对样本计数
		count[samples.at(0)] += 1;
		
		vals.clear(); //清空集合，为下次抽样做准备

		valsWithIndices.clear(); //清空集合，为下次抽样做准备

		samples.clear(); //清空样本集合，为下次抽样做准备

	}
	
	double sum = 0.0;  //用于概率求和

	//输出抽样结果
	std::cout << "总共抽样" << sampleTimes << "次，" << "各下标的频数及频率为：" << std::endl;

	for (size_t i = 0; i < 24; i++)
	{
		std::cout << i << "共有" << count[i] << "个   频率为：" << count[i] / double(sampleTimes) << std::endl;

		sum += count[i] / double(sampleTimes);
	}

	std::cout << "总频率为：" << sum << std::endl << std::endl;  //输出总概率
	//==========抽样测试==========

	//==========实际抽样==========
	//把权重值作为指数，均匀分布随机数作为底
	//相当于给权重增加了均匀随机扰动
	for (auto iter : wts)
	{
		vals.push_back(std::pow(u(gen), 1. / iter));
	}

	//按照扰动后的权重值从大到小排序，并扩展到索引
	for (size_t iter = 0; iter < vals.size(); iter++)
	{
		valsWithIndices.emplace_back(iter, vals[iter]);
	}

	std::sort(valsWithIndices.begin(), valsWithIndices.end(), [](auto x, auto y) {return x.second > y.second; });

	//抽样
	for (auto iter = 0; iter < sampleSize; iter++)
	{
		samples.push_back(valsWithIndices[iter].first);
	}

	sampleCount += 1; //抽样次数增加1

	//输出抽样结果
	std::cout << "从总体中抽取的" << sampleSize << "个样本的下标索引为：" << std::endl;

	for (auto iter : samples)
	{
		std::cout << iter << " ";
	}

	std::cout << std::endl;

	//输出抽样次数
	std::cout << "抽样次数为：" << sampleCount << std::endl;

	vals.clear(); //清空集合，为下次抽样做准备

	valsWithIndices.clear(); //清空集合，为下次抽样做准备

	samples.clear(); //清空样本集合，为下次抽样做准备

	//==========实际抽样==========

	std::cin.get(); //保留控制台窗口
	return 0;
}

输出结果：

总体为24个：
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

总共抽样10000次，各下标的频数及频率为：
0共有822个   频率为：0.0822
1共有752个   频率为：0.0752
2共有714个   频率为：0.0714
3共有641个   频率为：0.0641
4共有697个   频率为：0.0697
5共有646个   频率为：0.0646
6共有585个   频率为：0.0585
7共有536个   频率为：0.0536
8共有545个   频率为：0.0545
9共有499个   频率为：0.0499
10共有480个   频率为：0.048
11共有449个   频率为：0.0449
12共有363个   频率为：0.0363
13共有365个   频率为：0.0365
14共有347个   频率为：0.0347
15共有328个   频率为：0.0328
16共有274个   频率为：0.0274
17共有236个   频率为：0.0236
18共有211个   频率为：0.0211
19共有172个   频率为：0.0172
20共有139个   频率为：0.0139
21共有99个   频率为：0.0099
22共有60个   频率为：0.006
23共有40个   频率为：0.004
总频率为：1

从总体中抽取的24个样本的下标索引为：
10 9 5 7 4 13 2 14 21 8 3 11 6 19 0 12 16 1 17 18 15 20 22 23
抽样次数为：1

评述

随机扰动方案十分巧妙，就是将权重值或者说概率作为排序的依据，但是如果直接根据权重排序，则会造成权重大的永远在前面，因此要对其增加一个均匀随机扰动，保证了随机性，又使得权重大的更容易被抽取到。

你可能感兴趣的:(#,算法与设计模式,算法,概率论,抽样,离散分布)

计算机网络中常用的端口号以及对应的应用程序东锋1.3 计算机网络与通信网络
计算机网络中常用端口号及其应用程序详解在计算机网络的世界里，端口号扮演着至关重要的角色，它是标识网络应用程序的一种方式，使得不同的应用程序能够在同一台计算机上同时运行，并通过各自不同的端口与网络进行通信。在网络通信过程中，每个数据包都包含源端口号和目标端口号，以此来确保数据包能准确无误地传输到目标应用程序。接下来，让我们详细了解一些网络中常用的端口号及其对应的应用程序。1.端口号：80应用程序：H
SDK与API 东锋1.3 开发与应用软件构建软件工程
1.1.SDK的定义SDK是SoftwareDevelopmentKit的缩写，翻译成中文是：软件开发工具包。SDK是一组工具、库、文档和示例代码的集合，旨在帮助开发者更轻松地创建应用程序或集成特定服务。SDK通常由硬件平台、操作系统或服务提供商提供，以便开发者能够利用其平台或服务的功能。1.2.SDK的组成SDK通常可以包括以下内容：库或框架：提供预先编写的代码库，开发者可以直接调用这些库来实现
JavaScript常用的一些代码段东锋1.3 javascript javascript 开发语言 ecmascript
带有重复项使用递归。对于给定字符串中的每个字母，为字母创建字谜。使用map（）将字母与每部分字谜组合，然后使用reduce（）将所有字谜组合到一个数组中，最基本情况是字符串长度等于2或1。constanagrams=str=>{if(str.lengthacc.concat(anagrams(str.slice(0,i)+str.slice(i+1)).map(val=>letter+val)),
「Py」基础语法篇之 Python缩进规则何曾参静谧「Py」Python程序设计数据库
✨博客主页何曾参静谧的博客（✅关注、点赞、⭐收藏、转发）全部专栏（专栏会有变化，以最新发布为准）「Win」Windows程序设计「IDE」集成开发环境「UG/NX」BlockUI集合「C/C++」C/C++程序设计「DSA」数据结构与算法「UG/NX」NX二次开发「QT」QT5程序设计「File」数据文件格式「UG/NX」NX定制开发「Py」Python程序设计「Math」探秘数学世界「PK」Pa
ZXing库 -- 生成二维码蓝田～ python 开发语言
引言二维码（QRCode）因其高密度的数据存储能力和易于扫描的特性，在现代社会中得到了广泛应用。ZXing是一个开源的二维码生成与读取库，它支持多种编程语言，包括Java。本指南将详细介绍如何在Java项目中使用ZXing库来生成带有透明背景的二维码。准备ZXing库com.google.zxingcore3.4.1com.google.zxingjavase3.4.1生成二维码编写代码packa
适配器模式蓝田～适配器模式 python java
适配器模式（AdapterPattern）是一种结构型设计模式，它的主要目的是将一个类的接口转换成客户端所期待的另一种接口形式。这种模式使得原本由于接口不兼容而不能一起工作的类可以协同工作。适配器模式在软件开发中经常被用来使新的接口与老的接口能够一起工作，以利用现有的功能而不影响原有系统的稳定。实现方式‌类适配器‌通过多重继承对一个接口与另外一个接口进行匹配。具体来说，就是创建一个新类，这个新类既
日常小tip_Bat命令运行Java程序蓝田～小tips java 开发语言
批处理命令介绍文章目录介绍常用语法bat命令运行一个简单的Java程序介绍批处理命令一般是一个文本文件，文件的每一行命令都会在DOS中执行。一般用来处理需要重复性执行的命令。常用语法echo:表示显示此命令后的字符echooff:表示不显示此命令后的命令行本身的字符@:与echooff类似，但是这条命令加在命令行之前，表示不显示这一行的命令行字符call:调用另外一个批处理文件pause:暂停当前
React Native 0.77 发布：更强的样式支持与性能优化前端javascript
CSS技巧与案例详解vue2与vue3技巧合集VueUse源码解读ReactNative0.77正式发布！此次版本带来了多项重要改进，包括样式功能的增强、Android平台的性能优化以及项目模板的升级。这一版本的核心目标是提升开发效率，同时确保在不同平台上的兼容性。接下来，我们来看看这次更新中的亮点内容。主要更新内容✨全新CSS特性支持：新增对display:contents、boxSizing、
C++vector容器的使用 jax不摆烂 C++入门到精通 c++开发语言
目录一、C++中什么是vector容器二、vector的特点三、使用场景四、对vector容器的简单使用1、vector构造函数2、vector赋值操作3、vector容量与元素个数4、vector的插入和删除5、vector数据的存取6、vector容器互换7、预留空间一、C++中什么是vector容器在C++中，vector是一个非常常用的标准模板库（STL）容器，它提供了动态数组的功能。ve
MATLAB中的abs函数及其用法程序编码实践周师傅 matlab 开发语言编程
abs函数是MATLAB编程语言中的一个内置函数，用于计算给定数值的绝对值。它可以应用于标量、向量、矩阵或复数数据类型，并返回相应的绝对值结果。语法：y=abs(x)其中，x是输入数值，可以是标量、向量、矩阵或复数；y是返回的绝对值结果，与输入x的类型相同。下面我们将详细介绍abs函数的用法，并给出一些示例代码。计算标量的绝对值当输入参数为标量时，abs函数直接返回该标量的绝对值。示例代码：x=-
Linux系统(Ubuntu)上安装单机版Redis详细指南一休哥助手数据库 linux ubuntu redis
目录安装前的准备工作下载与安装Redis配置Redis启动RedisRedis基本操作配置Redis开机自启动常见问题及解决方案总结<
基于Python的开源量化交易框架：构建你的量化投资策略 ShAutoit python 开发语言
量化投资是一种利用数学和统计模型来进行投资决策的方法，它将大量的金融数据与算法相结合，以识别交易机会并执行交易。Python作为一种功能强大且易于使用的编程语言，为开发和实施量化交易策略提供了很好的支持。本文将介绍基于Python的开源量化交易框架，帮助你构建自己的量化投资策略。数据获取和处理在量化投资中，数据是至关重要的。你需要获取和处理市场数据，包括股票价格、指数数据、财务数据等。在Pytho
【Redis】Redis入门以及什么是分布式系统{Redis引入+分布式系统介绍} 阿猿收手吧！ #Redis redis 数据库缓存
文章目录介绍redis的引入分布式系统单机架构应用服务和数据库服务分离【负载均衡】引入更多的应用服务器节点单机架构分布式是什么数据库分离和负载均衡理解负载均衡数据库读写分离引入缓存数据库分库分表引入微服务介绍Theopensource,in-memorydatastoreusedbymillionsofdevelopersasadatabases，cache,streamingengine,and
浅谈 redis BigDeng_2014 工作 redis 数据库 java
redis特点：单进程多线程。主线程只有一个，还有两个副线程，用于文件和IO处理。可以集群部署，数据在各个机器上都有备份，挂了一台机器，可以从其他机器上找到数据。集群带来主从节点机制，一般至少需要3个节点来选举出主节点，也可以指定主节点。主从同步问题，会导致数据不一致。保证了分布式P和可用性A，牺牲了一致性C，可以保证最终一致性。比如数据恢复。把数据存放到内存，从内存查找数据比较快一些。有key-
【舞动奇迹，不屈的旋律】亨廷顿舞蹈症患者的活力锻炼秘籍✨ 养生小齐健康医疗生活
Hey小伙伴们~今天咱们来聊聊一个特别又温暖的话题，关于那些在生活中勇敢跳跃的“舞蹈精灵”——亨廷顿舞蹈症患者们！✨没错，即使面对挑战，他们依然能用独特的方式，诠释生命的律动与美好！首先，一个大大的拥抱给你们，每一个不屈的灵魂都值得被温柔以待！说到锻炼，对于亨廷顿舞蹈症的朋友们来说，它不仅仅是增强体质那么简单，更是心灵的疗愈之旅呢！1️⃣轻柔瑜伽，呼吸间的宁静‍♀️想象一下，清晨的第一缕阳光透过窗
命令模式 - 命令模式的设计思想 w(ﾟДﾟ)w吓洗宝宝了 C++从 0 到 1 命令模式 c++
引言在软件开发中，设计模式是解决常见问题的经典解决方案。命令模式（CommandPattern）是行为型设计模式之一，它将请求封装为对象，从而使你可以用不同的请求对客户进行参数化，并且支持请求的排队、记录日志以及撤销操作。本文将详细介绍命令模式的设计思想，并通过C++代码示例帮助读者深入理解。命令模式的定义命令模式的核心思想是将一个请求封装为一个对象，从而使你可以用不同的请求对客户进行参数化。命令
第四届先进材料与机械电子国际学术会议（ICAMM 2024） 2301_79125431 java
第四届先进材料与机械电子国际学术会议（ICAMM2024）【前三届均已见刊EI检索，检索信息均可查询！四大高校联合支持】2024年第四届先进材料与机械电子国际题解|字符串排序-golang最简洁最易懂解法packagemainimport("bufio""fmt&q题解|#数列求和#publicclassMain{publicstaticvoidmain(Str第四届图像处理与智能控制国际学术会议
深入探讨服务器虚拟化：架构、技术与应用码上飞扬服务器虚拟化 K8S Docker Xen KVM
1.引言在现代IT基础设施中，服务器虚拟化已成为一种不可或缺的技术。它不仅提高了资源利用率，还增强了系统的灵活性和可管理性。随着企业对高效、灵活和可扩展IT环境的需求不断增加，服务器虚拟化技术的应用愈发广泛。本文将深入探讨服务器虚拟化的基本概念、架构、常见技术及其实际应用，帮助读者更好地理解这一重要技术。2.什么是服务器虚拟化？服务器虚拟化是一种将物理服务器划分为多个虚拟服务器（虚拟机，VM）的技
java.sql.Date 弃用分析与替代方案蓝田～ java microsoft
引言java.sql.Date是Java标准库中的一个类，它继承自java.util.Date，主要用于在Java应用程序与数据库之间进行日期数据的传输。然而，随着Java语言的发展，java.sql.Date以及其父类java.util.Date逐渐被认为存在设计缺陷，并被新的日期时间API所替代。本文将对java.sql.Date的启用原因进行分析，并探讨其弃用原因及替代方案。启用原因分析SQ
npm:升级自身时报错:EBADENGINE 落日弥漫的橘_ Node.js npm 前端 node.js
具体报错信息如下：1.原因分析npm和当前的node版本不兼容。//当前实际版本:Actual:{"npm":"10.2.4","node":"v20.11.0"}可以通过官网文档查看与自己node版本兼容的是哪一版本的npm，相对应进行更新即可：Node.js—Node.js版本2.解决方法升级一下node版本。//需要node的版本号为^20.17.0以上，Required:{"node":"
pygame下载 2401_86461228 pygame python
pygame下载先进入pygame官网下载与你python对应的版本，然后解压：https://www.pygame.org/download.shtml然后打开cmd命令输入pipinstallpygame等待执行结束，然后打开python输入代码importpygame再运行，入出现以下情况说明安装成功注：我的python是32位的
【黑龙江乡镇界】面图层arcgis数据shp格式乡镇名称和编码wgs84无偏移内容测评鸿业远图科技 arcgis
本文将详细讲解与“最新黑龙江乡镇界面图层arcgis数据shp格式乡镇名称和编码wgs84无偏移”相关的知识点，包括GIS基础、ArcGIS软件、SHP文件格式、WGS84坐标系统以及乡镇行政数据的重要性。GIS基础GIS（GeographicInformationSystem，地理信息系统）是一种用于采集、存储、管理、分析和展示所有类型地理数据的系统。它整合了地图、数据库、统计分析和计算机图形等
24. C语言预处理器：技巧与陷阱涛ing C语言基础 c语言 linux c++开发语言 vscode vim 经验分享
本章目录:前言预处理器概述预处理器指令简介常见的预处理器指令实例1.定义宏常量2.引入头文件3.取消宏定义4.条件编译5.调试代码的条件编译预定义宏示例：使用预定义宏宏运算符1.宏延续运算符(`\`)2.字符串化运算符（`#`）3.标记粘贴运算符（`##`）4.`defined()`运算符宏与函数的区别错误的宏使用正确的宏使用总结前言在C语言的编程过程中，预处理器（Preprocessor，简称C
MyBatis 框架简介天之涯上上 mybatis tomcat java
MyBatis框架简介MyBatis是一个优秀的Java持久层框架，它主要用于简化应用程序与数据库之间的交互。通过MyBatis，开发者可以直接编写SQL语句或使用XML映射文件来操作数据库，同时保持代码的灵活性和高效性。MyBatis以其易用性、灵活性和对SQL的强大支持而闻名，尤其适用于复杂查询和高度定制化的数据库操作场景。MyBatis的主要功能和特点1.持久化操作MyBatis通过将Jav
JAVA开发中 MyBatis XML 映射文件的作用天之涯上上 java mybatis xml
MyBatisXML映射文件（通常是以.xml结尾的文件，例如UserMapper.xml）是MyBatis框架的重要组成部分，主要用于定义SQL语句、结果映射关系以及参数绑定。它的作用是将Java方法与SQL语句关联起来，实现持久化操作（如查询、插入、更新和删除）。以下是关于MyBatisXML映射文件的详细说明：1.XML映射文件的作用1.1定义SQL语句MyBatis的核心功能是操作数据库，
使用Python实现并行计算算法：效率提升的利器 Echo_Wish Python进阶 python 算法开发语言
在处理大规模数据和计算密集型任务时，单线程的处理方式往往显得力不从心。并行计算作为一种提升计算效率的重要手段，能够充分利用多核处理器的优势，加速任务的完成。Python作为一种灵活且功能强大的编程语言，提供了丰富的并行计算工具。本文将详细介绍如何使用Python实现并行计算算法，并通过具体代码示例展示其实现过程。项目概述本项目旨在通过Python实现一个并行计算算法，展示如何利用Python的多线
学不会设计模式？来看看这些简单又实用的手写代码！程序员小续 javascript 开发语言 ecmascript 前端框架前端 react.js vue.js
1.单例模式(Singleton)特点：确保一个类只有一个实例，并提供全局访问点。用途：常用于全局状态管理、配置管理等。classSingleton{constructor(name){if(Singleton.instance)returnSingleton.instance;//如果已有实例，返回该实例this.name=name;Singleton.instance=this;//保存实例}
JavaFX 实现 Loading 效果的组件与案例详解 J老熊 java 服务器开发语言后端面试系统架构软件工程
JavaFX中的Loading组件概述JavaFX提供了两个用于显示任务进度的核心组件：ProgressIndicator：以圆形动画的形式展示任务进度，适用于未定义进度的任务。ProgressBar：以水平条的形式展示任务进度，适用于可以量化进度的任务。这两个组件可直接绑定到后台任务的progress属性，实时更新界面。1.ProgressBar的常见方法ProgressBar是以水平条的形式显
python并行计算 weixin_30894389
0.基础并行/发：multiprocessing/threading1.concurrent2.并发：asynico3.Ipython下的并行计算：使用ipyparallel库的IPython提供了前所未有的能力，将科学Python的探索能力与几乎即时访问多个计算核心相结合。系统可以直观地与本地或网络的计算节点集群进行交互，而不管集群的实现方式如何。这种易于交互使用帮助IPython和Python
Kafka 消息存储与销毁机制 AI天才研究院大数据AI人工智能计算 kafka wpf 分布式
Kafka消息存储与销毁机制文章目录Kafka消息存储与销毁机制1.背景介绍1.1什么是Kafka1.2Kafka的基本概念解释2.核心概念与联系2.1消息存储机制2.2消息销毁机制2.3分区与副本机制3.核心算法原理具体操作步骤3.1消息存储过程3.2消息消费过程3.3消息销毁过程3.4分区副本同步过程4.数学模型和公式详细讲解举例说明4.1消息存储模型4.2消息销毁模型4.3分区副本同步模型5
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul