题目:Tango是微软亚洲研究院的一个试验项目。研究院的员工和实习生们都很喜欢在Tango上面交流灌水。传说,Tango有一大“水王”,他不但喜欢发贴,还会回复其他ID发的每个帖子。坊间风闻该“水王”发帖数目超过了帖子总数的一半。如果你有一个当前论坛上所有帖子(包括回帖)的列表,其中帖子作者的ID也在表中,你能快速找出这个传说中的Tango水王吗? –《编程之美》
扩展:随着Tango的发展,管理员发现,“超级水王”没有了。统计结果表明,有3个发帖很多的ID,他们的发帖数目都超过了帖子总数目N的1/4。你能从发帖ID列表中快速找出他们的ID吗?
分析:在这个题目中,有一个计算机科学中很普遍的思想,就是如何把一个问题转化为规模较小的若干个问题。分治、递推和贪心等都有这样的思想。在转化过程中,如果能保证小的问题跟原问题的解是一致的就成功了。这样,我们可以通过寻找这样的方式将小问题转化为更小的问题。如何将大问题拆成小问题,或者如何大规模的数据降成小规模,而不影响解呢?
如果每次删除两个不同的ID,不管删除的ID是否包含“水王”的ID,在剩下的ID列表中,“水王”ID出现的次数仍然超过总数的一半。想到这一点之后,上述分析的思想已经构筑完成,就可以通过不断重复这个过程,把ID列表中的ID总数降低(转化为更小的问题),从而得到问题的答案。新的思路,避免了排序这个耗时的步骤,总的时间复杂度只有O(N),且只需要常数的额外内存。
代码如下:
#include <stdio.h> typedef int Type; Type find (Type *a, int N) { Type candiate; int i, nTimes; for (i = nTimes = 0; i < N; i++) { if (0 == nTimes) { candiate = a[i]; nTimes = 1; } else { if (candiate == a[i]) { nTimes++; } else { nTimes--; } } } return candiate; } int main() { Type arr[] = {1, 2, 3, 4, 2, 5, 2, 2, 3, 2, 5, 2}; printf("over harf id is %d\n", find(arr, 12)); return 0; }
解扩展题:
求解内容极其相似,相同的思路进行求解即可。同时删除4个不同的ID后,剩余数据中3个多数id仍然是多数ID。
上题只需要一个结果,而现在需要3个结果,上题用到的nTimes,也应改为3个计数器。现在我们需要3个变量来记录当前遍历过的3个不同的ID,而nTimes的3个元素分别对应当前遍历过的3个ID出现的个数。如果遍历中有某个ID不同于这3个当前ID,我们就判断当前3个ID是否有某个的nTimes为0,如果有,那这个新遍历的ID就取而代之,并赋1为它的遍历数(即nTimes减1),如果当前3个ID的nTimes皆不为0,则3个ID的nTimes皆减去1。
#include <iostream> using namespace std; int candidate[3]; int count[3] = {0}; int input[100]; int num = 0; int main() { cout<<"please input"<<endl; int t; while(cin>>t) { if (t == -1) break; input[num++] = t; } bool flag = false; for (int i = 0;i < num;i++) { flag = false; for (int j = 0;j < 3;j++) { if (count[j] == 0) { continue; } if (candidate[j] == input[i]) { count[j]++; flag = true; } } if (flag == true) { continue; } for (int j = 0;j < 3;j++) { if (count[j] == 0) { candidate[j] = input[i]; count[j]++; flag = true; break; } } if (flag == true) { continue; } for (int j = 0;j < 3;j++) { count[j]--; } } cout<<count[0]<<" "<<count[1]<<" "<<count[2]<<endl; cout<<candidate[0]<<" "<<candidate[1]<<" "<<candidate[2]<<endl; }