众所周知我是一个卡常狂魔其实是因为算法太差干不过机房其他大佬所以才卡常的
所以平时也有了解一些比较玄学的算法
这其中就包括基数排序和手动Ofast,指针,循环展开,寄存器,快速IO,fread,fwrite,长达四十四行的预处理,三目运算符,还有各种骚操作
基数排序(英语:Radix sort)是一种非比较型整数排序算法,其原理是将整数按位数切割成不同的数字,然后按每个位数分别比较。
——某不存在的百科
它的原理就是:按第一位排序,按第二位排序(同时不改变第一位大小顺序),然后在不打扰前面形成的序列的情况下再按第三位排序
不好说,看图
首先按照个位分类
把每一个类别变成一个链表
然后把这个链表按照从小到大的顺序连起来:
这就是按个位从大到小排好的数组
再按照十位排一次
再连起来
就排好了
再长的数就再重复百位,千位,万位……直到排好为止
估计读者是看懂了,但是正确性……
感性证明一下:
第一轮我们确定了个位小的肯定排在前面
而第二轮入队时,个位小的又优先入队,也排在每一队的前面
如果有第三轮,最低两位小的又优先入队……以此类推
也就相当于做了这样的一个cmp
:当当前位位小的时候,保证让它排前面(由链表的拼接保证)
当当前位一样,而历史结果小的时候,也让它排前面(由之前的排序与入队顺序保证)
每一次都保证最高位一定是从小到大排上去的,而每一次排序都不会影响到低位排序的结果
其实也可以理解作魔改的桶排
说不明白我也没办法了
这种办法是我一开始采取的,使用链表模拟上面的过程
直接模拟也没什么好说的啦
这种方法只写伪代码了啊
for k 1~最高位
for i:1~n
a[i]进入:链表[当前位]
for i:0~9
for k:链表[i]的各个节点
将值插入a
真的把链表模拟出来太低效而且low爆了
我们用一个cnt数组记录当前位为i的数有多少个
然后计算前缀和得出每一队队尾应该待在什么地方
从后往前遍历数组(队尾优先),把每个队还原出来
memset(cnt,0,sizeof(cnt));
for(int i=1;i<=n;i++)
cnt[now(a[i])]++;
for(int i=1;i<=9;i++)
cnt[i]+=i-1;
for(int i=n;i>=1;i--)
tmp[cnt[now(a[i])]--]=a[i];
其中now()
是求当前位的函数
设这些数中最大的数为 n n n,个数为 N N N
则针对每一位的排序需要进行 log 10 n \log_{10}n log10n次
而每一次复杂度为 O ( N ) O(N) O(N)
所以总体复杂度为 O ( N log 10 n ) O(N\log_{10}n) O(Nlog10n)
慢着!!!!
你不知道除法和模运算的常数是很大的吗?
你不知道每一次整数除法要耗费乘法五倍以上的时间吗?
你不知道位运算的速度飞快吗?
你不知道我们可以换进制吗?
我们可以把cnt数组扩大到 2 16 2^{16} 216,那么对于一个int,我们固定排两次就好了
故原来的复杂度可以降为 O ( n ) O(n) O(n)
而且取余和除法可以用位运算代替,常数也可以小很多
这个世界上总有那么一些神仙闲着没事干
比如著名的王逸松毒瘤同学
他在WC2017中出了一道IOI三合一:挑战
第一个子任务便是排序……用你最快的方法
这学过的都知道用基排
但是……你们听说过松式基排吗?
普通的基排采用65536作为cnt数组的大小
而松式基排采用了256
虽然看起来循环次数从2次上升到4次
但是缩小的cnt数组更容易进入当时€€£老爷机小得可怜的缓存
从而导致cnt数组的访问速度得到了神一般的飞跃
最后反而还加速了!!!
当然,时至今日,CCF已经不像过去那般吝啬,终于给我们换评测机了
而评测机采用的CPU i7-6700K也配上了每个核心32KB的一级缓存
虽然可能还是装不下65536大小的数组,但是松式基排的作用已经不那么大了
也许,它会像那些上世纪编程工作者面对少得可怜的硬件资源时创造出的奇迹一样被世界所淡忘
但是,这种将优化进行到底的精神,确实值得我们学习
#include
#include
int a[5000001],cnt[65536],tmp[5000001];
int main()
{
register int n;
scanf("%d",&n);
for(register int i=1;i<=n;++i)
scanf("%d",a+i);
for(register int i=1;i<=n;++i)
++cnt[a[i]&0xffff];
for(register int i=1;i<=1<<16;++i)
cnt[i]+=cnt[i-1];
for(register int i=n;i;--i)
tmp[cnt[a[i]&0xffff]--]=a[i];
memcpy(a+1,tmp+1,n<<2);
memset(cnt,0,sizeof(cnt));
for(register int i=1;i<=n;++i)
++cnt[(a[i]>>16)&0xffff];
for(register int i=1;i<=1<<16;++i)
cnt[i]+=cnt[i-1];
for(register int i=n;i;--i)
tmp[cnt[(a[i]>>16)&0xffff]--]=a[i];
memcpy(a+1,tmp+1,n<<2);
for(register int i=1;i<=n;++i)
printf("%d ",a[i]);
return 0;
}