bzoj 4198(哈夫曼编码)

4198: [Noi2015]荷马史诗

Time Limit: 10 Sec   Memory Limit: 512 MB
Submit: 549   Solved: 279
[ Submit][ Status][ Discuss]

Description

追逐影子的人,自己就是影子。 ——荷马

Allison 最近迷上了文学。她喜欢在一个慵懒的午后,细细地品上一杯卡布奇诺,静静地阅读她爱不释手的《荷马史诗》。但是由《奥德赛》和《伊利亚特》组成的鸿篇巨制《荷马史诗》实在是太长了,Allison 想通过一种编码方式使得它变得短一些。
一部《荷马史诗》中有 n 种不同的单词,从 1 到 n 进行编号。其中第 i 种单词出现的总次数为 wi。Allison 想要用 k 进制串 si 来替换第 i 种单词,使得其满足如下要求:
对于任意的 1≤i,j≤n,i≠j,都有:si 不是 sj 的前缀。
现在 Allison 想要知道,如何选择 si,才能使替换以后得到的新的《荷马史诗》长度最小。在确保总长度最小的情况下,Allison 还想知道最长的 si 的最短长度是多少?
一个字符串被称为 k 进制字符串,当且仅当它的每个字符是 0 到 k−1 之间(包括 0 和 k−1)的整数。
字符串 Str1 被称为字符串 Str2 的前缀,当且仅当:存在 1≤t≤m,使得 Str1=Str2[1..t]。其中,m 是字符串 Str2 的长度,Str2[1..t] 表示 Str2 的前 t 个字符组成的字符串。

Input

输入文件的第 1 行包含 2 个正整数 n,k,中间用单个空格隔开,表示共有 n 种单词,需要使用 k 进制字符串进行替换。

接下来 n 行,第 i+1 行包含 1 个非负整数 wi,表示第 i 种单词的出现次数。

Output

输出文件包括 2 行。

第 1 行输出 1 个整数,为《荷马史诗》经过重新编码以后的最短长度。
第 2 行输出 1 个整数,为保证最短总长度的情况下,最长字符串 si 的最短长度。

Sample Input

4 2
1
1
2
2

Sample Output

12
2

HINT

用 X(k) 表示 X 是以 k 进制表示的字符串。

一种最优方案:令 00(2) 替换第 1 种单词,01(2) 替换第 2 种单词,10(2) 替换第 3 种单词,11(2) 替换第 4 种单词。在这种方案下,编码以后的最短长度为:


1×2+1×2+2×2+2×2=12

最长字符串 si 的长度为 2。


一种非最优方案:令 000(2) 替换第 1 种单词,001(2) 替换第 2 种单词,01(2) 替换第 3 种单词,1(2) 替换第 4 种单词。在这种方案下,编码以后的最短长度为:


1×3+1×3+2×2+2×1=12

最长字符串 si 的长度为 3。与最优方案相比,文章的长度相同,但是最长字符串的长度更长一些。


对于所有数据,保证 2≤n≤100000,2≤k≤9。


选手请注意使用 64 位整数进行输入输出、存储和计算。



解题思路:因为要保证Si不为Sj的前缀。所以就可以想到哈夫曼编码。然后发现当k=2是就是合并果子。其实k叉树的做法也是一样的。每次去最小的k个合并即可。发现只有当(n-1)%(k-1)=0的时候才能恰好合并,所以要添加k-1-(n-1)%(k-1)个权值为0高度为1的虚拟节点。然后用堆维护一下最小值就好了。为了保证最大高度最小,我们把高度加进比较的第二关键字。


#include<cstdio>
#include<cstring>
#include<algorithm>
#include<iostream>
using namespace std;
int n,k,len=1;
const long long INF=900000000;
struct ss
 {
  long long x,y;
 }q[1000000];
long long w[100001],deep[100001];


inline long long read()
 {
  char y; long long x=0,f=1; y=getchar();
  while (y<'0'||y>'9') {if (y=='-') f=-1; y=getchar();}
  while (y>='0' && y<='9') {x=x*10+int(y)-48; y=getchar();}
return x*f;
 }


bool compare(ss xg,ss yg)
 {
  if (xg.x<yg.x) return true;else
  if (xg.x==yg.x && xg.y<yg.y)return true;else return false;
 }


void pop(long long x,long long y) 
 {
  ++len; q[len].x=x; q[len].y=y;
  int u=len;
  while (u>1)
  {
   if (compare(q[u],q[u/2]))
    {
    swap(q[u],q[u/2]);
    u=u/2;
  }else return;
}
 }


void push()
 {
  swap(q[1],q[len]); --len;
  int u=1;
  while (u*2<=len | u*2+1<=len)
  {
  int h=0;
  if (u*2+1>len || compare(q[u*2],q[u*2+1]))
  h=u*2;else h=u*2+1;
  if (compare(q[h],q[u]))
  {
  swap(q[h],q[u]);
  u=h;
}else return;
 }
 }


int main()
{
n=read(); k=read(); len=0;
for (int i=1;i<=n;++i)
{
w[i]=read(); deep[i]=1;
pop(w[i],deep[i]);
}
if ((n-1)%(k-1)!=0)
for (int i=1;i<=(k-1-(n-1)%(k-1));++i)
 pop(0,1);
long long ans=0;
while (len!=1)
{
long long sum=0,dee=-1;
for (int i=1;i<=k;++i)
{
sum+=q[1].x; dee=max(dee,q[1].y);
   push();
}
ans+=sum;
pop(sum,dee+1);
}
printf("%lld\n%lld",ans,q[1].y-1);
}  

你可能感兴趣的:(bzoj 4198(哈夫曼编码))