• [BZOJ4198] [Noi2015] 荷马史诗 (贪心)


    Description

      追逐影子的人,自己就是影子。 ——荷马
     
      Allison 最近迷上了文学。她喜欢在一个慵懒的午后,细细地品上一杯卡布奇诺,静静地阅读她爱不释手的《荷马史诗》。但是由《奥德赛》和《伊利亚特》组成的鸿篇巨制《荷马史诗》实在是太长了,Allison 想通过一种编码方式使得它变得短一些。
      一部《荷马史诗》中有 n 种不同的单词,从 1 到 n 进行编号。其中第 i 种单词出现的总次数为 wi。Allison 想要用 k 进制串 si 来替换第 i 种单词,使得其满足如下要求:
      对于任意的 1≤i,j≤n,i≠j,都有:si 不是 sj 的前缀。
      现在 Allison 想要知道,如何选择 si,才能使替换以后得到的新的《荷马史诗》长度最小。在确保总长度最小的情况下,Allison 还想知道最长的 si 的最短长度是多少?
      一个字符串被称为 k 进制字符串,当且仅当它的每个字符是 0 到 k−1 之间(包括 0 和 k−1)的整数。
      字符串 Str1 被称为字符串 Str2 的前缀,当且仅当:存在 1≤t≤m,使得 Str1=Str2[1..t]。其中,m 是字符串 Str2 的长度,Str2[1..t] 表示 Str2 的前 t 个字符组成的字符串。

    Input

      输入文件的第 1 行包含 2 个正整数 n,k,中间用单个空格隔开,表示共有 n 种单词,需要使用 k 进制字符串进行替换。
      接下来 n 行,第 i+1 行包含 1 个非负整数 wi,表示第 i 种单词的出现次数。

    Output

      输出文件包括 2 行。
      第 1 行输出 1 个整数,为《荷马史诗》经过重新编码以后的最短长度。
      第 2 行输出 1 个整数,为保证最短总长度的情况下,最长字符串 si 的最短长度。

    Sample Input

    4 2
    1
    1
    2
    2

    Sample Output

    12
    2

    HINT

      用 X(k) 表示 X 是以 k 进制表示的字符串。
      一种最优方案:令 00(2) 替换第 1 种单词,01(2) 替换第 2 种单词,10(2) 替换第 3 种单词,11(2) 替换第 4 种单词。在这种方案下,编码以后的最短长度为:1×2+1×2+2×2+2×2=12
      最长字符串 si 的长度为 2。
      一种非最优方案:令 000(2) 替换第 1 种单词,001(2) 替换第 2 种单词,01(2) 替换第 3 种单词,1(2) 替换第 4 种单词。在这种方案下,编码以后的最短长度为:1×3+1×3+2×2+2×1=12
      最长字符串 si 的长度为 3。与最优方案相比,文章的长度相同,但是最长字符串的长度更长一些。
     
      对于所有数据,保证 2≤n≤100000,2≤k≤9。
      选手请注意使用 64 位整数进行输入输出、存储和计算。

    Source

    Solution

      题目背景已经暗示了这题需要用到哈夫曼编码

      一句话概括(摘自百度百科):在变字长编码中,如果码字长度严格按照对应符号出现的概率大小逆序排列,则其平均码字长度为最小

      所以我们从下往上构造哈夫曼树,贪心取权值最小的$k$个节点重新构造成一个节点,该点权值为这几个点的点权和,可以用$priority$_$queue$实现

      为了做第二问,我们可以在优先队列里存$pair$,第一个元素是出现次数,第二个元素是最长长度,这样可以使得每次选的长度尽量小,可以得到最优解

      当$k eq 2$时,完美合并(感性理解这个词)需要满足$nequiv 1 (mod k-1)$,不满足这个条件时相当于额外添了几个出现次数为$0$的单词

      所以$k eq 2$时我们先补权值为$0$的节点使得可以完美合并,之后贪心即可

     1 #include <bits/stdc++.h>
     2 #define fir first
     3 #define sec second
     4 using namespace std;
     5 typedef long long ll;
     6 typedef pair<ll, ll> pll;
     7 priority_queue<pll, vector<pll>, greater<pll> > PQ;
     8 int main()
     9 {
    10     int n, k;
    11     pll x, y, ans;
    12     cin >> n >> k;
    13     for(int i = 1; i <= n; ++i)
    14     {
    15         cin >> x.first;
    16         PQ.push(x);
    17     }
    18     while(k > 2 && n % (k - 1) != 1)
    19         PQ.push(y), ++n;
    20     while(PQ.size() != 1)
    21     {
    22         y.fir = y.sec = 0;
    23         for(int i = 1; i <= k; ++i)
    24         {
    25             x = PQ.top(), PQ.pop();
    26             y.fir += x.fir;
    27             y.sec = max(y.sec, x.sec + 1);
    28         }
    29         ans.fir += y.fir;
    30         ans.sec = max(ans.sec, y.sec);
    31         PQ.push(y);
    32     }
    33     cout << ans.fir << endl << ans.sec << endl;
    34     return 0;
    35 }
    View Code
  • 相关阅读:
    Linux安装配置tomcat
    linux 安装jdk
    让/etc/profile文件修改后立即生效
    group by 和聚合函数
    mysql插入日期 vs oracle插入日期
    Thinkphp学习笔记-删除缓存
    Thinkphp错误-phpMyAdmin 尝试连接到 MySQL 服务器,但服务器拒绝连
    Thinkphp学习笔记-模板赋值
    Thinkphp学习笔记-模板主题
    Windows-设置系统服务不开机启动
  • 原文地址:https://www.cnblogs.com/CtrlCV/p/5619680.html
Copyright © 2020-2023  润新知