编程之美2.3 寻找发帖“水王”


题目:Tango是微软亚洲研究院的一个试验项目。研究院的员工和实习生们都很喜欢在Tango上面交流灌水。传说,Tango有一大“水王”,他不但喜欢发贴,还会回复其他ID发的每个帖子。坊间风闻该“水王”发帖数目超过了帖子总数的一半。如果你有一个当前论坛上所有帖子(包括回帖)的列表,其中帖子作者的ID也在表中,你能快速找出这个传说中的Tango水王吗? 


本题最原始的解法是将ID进行排序,再逐一遍历,找出出现次数超过一半的ID;这样的话如果采取最快的排序方法也要O(lgn),总的时间开销为O(nlgn)+n;
再想下,可以发现当所有ID排好序后,在N/2的位置必然是“水王”ID,因为n(ID)>n/2;因此复杂度可降低到O(n*lgn);

书中给出了一种简单的方法,“消除法”,每次删除两个不同的ID,剩余的即是“水王”ID;重复这个步骤,可以将序列降到最短,免除了排序这一步骤,大大提高了时间复杂度;

代码如下:
#include 
using namespace std;

void find(int *p, int n)
{
	int candidate, times = 0;
	int i;
	for(i = times = 0; i < n; i++)
	{
		if(times == 0)
		{
			candidate = p[i];
			times++;
		}
		else
		{
			if(candidate == p[i])
				times++;
			else
				times--;
		}
	}
	cout <



扩展问题:随着Tango的发展,管理员发现,“超级水王”没有了。统计结果表明,有3个发帖很多的ID,他们的发帖数目都超过了帖子总数目N的1/4。你能从中快递找出他们的ID吗?


思考:看到扩展问题,我首先想的是可以将ID序列分为几组,两两对比来进行消除,后面发现貌似不能实施;找了下资料,看见有人提出可以用3个candidate和3个times来标记3个ID,顿时茅塞顿开。跟原始问题的思路是一样的,遍历数组,依次与candidate[i]进行对比,若一样则times[i]+1;最终可以找出3个candidate;

代码如下:

void findext(int *p, int n)
{
	int candidate[3], times[3] = {0,0,0};
	int i, j;
	for(i = 0; i < n; i++)
	{
		if(times[0] == 0)
		{
			candidate[0] = p[i];
			times[0]++;
		}
		else if(candidate[0] == p[i])
		{
			times[0]++;
		}
		else if(times[1] == 0)
		{
			candidate[1] = p[i];
			times[1]++;
		}
		else if(candidate[1] == p[i])
		{
			times[1]++;
		}
		else if(times[2] == 0)
		{
			candidate[2] = p[i];
			times[2]++;
		}
		else if(candidate[2] == p[i])
		{
			times[2]++;
		}
		else
		{
			times[0]--;
			times[1]--;
			times[2]--;
		}
	}
	for(j = 0; j < 3; j++)
		cout <


评:上面的代码有点机械,网上看到有同学贴出其它代码,其实原理是一样的,只是判断顺序有异,在此就不列了。
编程之美这书很经典,每次都可以让人耳目一新,茅塞顿开的,希望慢慢地能训练出良好的解题思维!加油~~~

你可能感兴趣的:(编程之美2.3 寻找发帖“水王”)