#130. 【NOI2015】荷马史诗
追逐影子的人,自己就是影子。 ——荷马
Allison 最近迷上了文学。她喜欢在一个慵懒的午后,细细地品上一杯卡布奇诺,静静地阅读她爱不释手的《荷马史诗》。但是由《奥德赛》和《伊利亚特》组成的鸿篇巨制《荷马史诗》实在是太长了,Allison 想通过一种编码方式使得它变得短一些。
一部《荷马史诗》中有 n 种不同的单词,从 1 到 n 进行编号。其中第 i 种单词出现的总次数为 wi。Allison 想要用 k 进制串 si 来替换第 i 种单词,使得其满足如下要求:
对于任意的 1≤i,j≤n,i≠j,都有:si 不是 sj 的前缀。
现在 Allison 想要知道,如何选择 si,才能使替换以后得到的新的《荷马史诗》长度最小。在确保总长度最小的情况下,Allison 还想知道最长的 si 的最短长度是多少?
一个字符串被称为 k 进制字符串,当且仅当它的每个字符是 0 到 k−1 之间(包括 0 和 k−1)的整数。
字符串 Str1 被称为字符串 Str2 的前缀,当且仅当:存在 1≤t≤m,使得 Str1=Str2[1..t]。其中,m 是字符串 Str2 的长度,Str2[1..t] 表示 Str2 的前 t 个字符组成的字符串。
输入格式
输入文件的第 1 行包含 2 个正整数 n,k,中间用单个空格隔开,表示共有 n 种单词,需要使用 k 进制字符串进行替换。
接下来 n 行,第 i+1 行包含 1 个非负整数 wi,表示第 i 种单词的出现次数。
输出格式
输出文件包括 2 行。
第 1 行输出 1 个整数,为《荷马史诗》经过重新编码以后的最短长度。
第 2 行输出 1 个整数,为保证最短总长度的情况下,最长字符串 si 的最短长度。
样例一
input
4 2 1 1 2 2
output
12 2
explanation
用 X(k) 表示 X 是以 k 进制表示的字符串。
一种最优方案:令 00(2) 替换第 1 种单词,01(2) 替换第 2 种单词,10(2) 替换第 3 种单词,11(2) 替换第 4 种单词。在这种方案下,编码以后的最短长度为:
1×2+1×2+2×2+2×2=12
最长字符串 si 的长度为 2。
一种非最优方案:令 000(2) 替换第 1 种单词,001(2) 替换第 2 种单词,01(2) 替换第 3 种单词,1(2) 替换第 4 种单词。在这种方案下,编码以后的最短长度为:
1×3+1×3+2×2+2×1=12
最长字符串 si 的长度为 3。与最优方案相比,文章的长度相同,但是最长字符串的长度更长一些。
样例二
input
6 3 1 1 3 3 9 9
output
36 3
explanation
一种最优方案:令 000(3) 替换第 1 种单词,001(3) 替换第 2 种单词,01(3) 替换第 3 种单词,02(3) 替换第 4 种单词,1(3) 替换第 5 种单词,2(3) 替换第 6 种单词。
样例三
见样例数据下载。
限制与约定
测试点编号 | n 的规模 | k 的规模 | 备注 | 约定 |
---|---|---|---|---|
1 | n=3 | k=2 | 0<wi≤1011 | |
2 | n=5 | k=2 | ||
3 | n=16 | k=2 | 所有 wi 均相等 | |
4 | n=1000 | k=2 | wi 在取值范围内均匀随机 | |
5 | n=1000 | k=2 | ||
6 | n=100000 | k=2 | ||
7 | n=100000 | k=2 | 所有 wi 均相等 | |
8 | n=100000 | k=2 | ||
9 | n=7 | k=3 | ||
10 | n=16 | k=3 | 所有 wi 均相等 | |
11 | n=1001 | k=3 | 所有 wi 均相等 | |
12 | n=99999 | k=4 | 所有 wi 均相等 | |
13 | n=100000 | k=4 | ||
14 | n=100000 | k=4 | ||
15 | n=1000 | k=5 | ||
16 | n=100000 | k=7 | wi 在取值范围内均匀随机 | |
17 | n=100000 | k=7 | ||
18 | n=100000 | k=8 | wi 在取值范围内均匀随机 | |
19 | n=100000 | k=9 | ||
20 | n=100000 | k=9 |
对于所有数据,保证 2≤n≤100000,2≤k≤9。
选手请注意使用 64 位整数进行输入输出、存储和计算。
时间限制:1s
空间限制:512MB
评分方式
对于每个测试点:
若输出文件的第 1 行正确,得到该测试点 40% 的分数;
若输出文件完全正确,得到该测试点 100% 的分数。
下载
正解:Huffman树+贪心 参考这里
题目要求的限制条件很多,既要求替换后无二义性,又要求方案的最值,还有k进制的限制= =。
Point[哈夫曼树or哈夫曼编码]:参考这里
哈夫曼树一般是二叉树,建树的方法就是每次选择两个权值(即出现次数)最小的点,删除这2个点,加入一个权值是这两个点之和的新点进去。并且使这被删除的2个点的父亲成为那个新点。
编码的时候左支和右支一个是1一个是0,从根节点到叶子节点经过的边的1/0序列就是叶子节点对应的编码。
[2叉——>k叉]:
然而这个题是k叉树,方法和上面类似,然而每次选择k个权值最小的点的时候容易让最后一次合并的时候的点不足k个。假设最初有n个点,最后有1个点,每次合并删除k个点又放进1个点。那么易得:(n-1)是(k-1)的倍数。如果(n-1)%(k-1)!=0,那么就要再放入(k-1-(n-1)%(k-1))个虚拟点,并且它们的权值为0,它们也参与求最小k个点。
然而此题还要求si的最大值最小,因此我们让点代表一个二元组(val,dep),表示这个点的权值和点在树中的深度。在求最小k个点时,把val作为第一比较条件,如果val值相等,则把dep小的放在前面,这样在每次合并的时候,深度小的点都会被优先合并,保证了根到叶子的最长链的长度尽量小。
[具体实现]:
(1)处理这n个权值,加入虚拟点,这些点的val值上文已经告诉,dep值为0,ans=0;
(2)每次取出前k小的点,求它们的val之和sum,求它们的dep的最大值d,那么放入的新点应该是(sum,d+1),把它放入原来的容器(堆or优先队列)里面并要求有序,且ans+=sum(画一棵哈夫曼树,想想求文章长度的过程能这么实现的原理);
(3)当容器内只有一个点时,输出ans和这个点的dep值。
时间复杂度:O(nlogkn)
#include<cstdio> #include<queue> #include<iostream> typedef long long ll; using namespace std; inline void read(ll &x){ register char ch=getchar();x=0; while(ch<'0'||ch>'9') ch=getchar(); while(ch>='0'&&ch<='9') x=(x<<3)+(x<<1)+ch-'0',ch=getchar(); } struct node{ ll val,dep; node(){} node(ll _val,ll _dep){ val=_val;dep=_dep; } bool operator <(const node &a)const{ return val!=a.val?val>a.val:dep>a.dep; } }t; priority_queue<node>q; ll n,m,k,w,ans,DEEP; int main(){ read(n);read(k); for(int i=1;i<=n;i++) read(w),q.push(node(w,1)); if((w=(n-1)%(k-1))){ w=k-1-w;n+=w; for(int i=1;i<=w;i++) q.push(node(0,1)); } for(ll tot,maxd;n>1;n-=k-1){ tot=0;maxd=0; for(int i=k;i;i--){ t=q.top();q.pop(); tot+=t.val; maxd=max(maxd,t.dep); } q.push(node(tot,maxd+1)); ans+=tot; DEEP=max(DEEP,maxd); } cout<<ans<<' '<<DEEP; return 0; }