• 关于 double sort 这道题的思考


    声明

       笔者最近意外的发现 笔者的个人网站 http://tiankonguse.com/ 的很多文章被其它网站转载,但是转载时未声明文章来源或参考自 http://tiankonguse.com/ 网站,因此,笔者添加此条声明。

        郑重声明:这篇记录《关于 double sort 这道题的思考》转载自 http://tiankonguse.com/ 的这条记录:http://tiankonguse.com/record/record.php?id=651

    前言

    前言的前言

    昨天本来写好了这篇记录,可恨中间我出去打了一个电话,回来继续写,写完我想到可能session已经失效,所以我新打开一个页面,登录,然后在这个页面提交。返回了提交成功的标签,但是跳转到那篇文章时提示不存在。这个,我不能再忍受了,于是自己做了一个自动保存的功能。

    首先今天写的内容将会简短,因为昨天写的好久好久,结果自动保存功能还没有实现。不过现在,时刻都在自动保存着,再也不用担心这个问题了。

    首先声明这篇记录不是解题报告,只是一场我的大脑里思路的旅行。

    前几天学弟学妹们有一场比赛,学弟邀请我作为技术支持者去帮忙,在那个过程中我看了几道题。

    其中有两道题正常比赛没有其他人提交,于是我研究了一下。

    研究的第一道就一个暴力dfs就可以过,只是可能正常比赛没人看懂题意,我看了好几个小时才看懂的。

    第二道就是 double sort。

    正文

    题意

    什么是 double sort 呢?

    就以题目中的讲解例子来说说吧。

    题目说对于一组数 [5; 4; 3; 2; 1], 如果只可以交换相邻的数字,要使这组数达到升序至少需要 10 步。

    这个很好理解,假设一个数字要和左面的数字交换,那只有一种情况。

    但是对于两组数 [5,5; 4,4; 3,3; 2,2; 1,1] 来说,也是只能交换相邻的数字。这是一个数字和左面的数字交换时就有两种情况了。

    比如对于 4 可以和 第一个5交换,也可以和第二个5交换。

    目标是使这两组数字达到升序。题意还说这个例子的答案是 15 ,不是 20.

    然后,没然后了。

    错误的题意

    看完上面的题意,我有一个疑问:难道真的是要排成 [5,5; 4,4; 3,3; 2,2; 1,1] 的样子吗? 15 步可能吗?

    于是我猜测可能是达到每组升序即可,比如 [4,5; 4,5; 2,3; 2,3; 1,1], 这样第一组是 [4; 4; 2; 2; 1], 第二组书[5; 5; 3; 3; 1].

    于是我写了一个暴力程序,第一组样例还真跑出一个 15 的答案来。

    但是第二组 答案大小比样例少了1。

    既然结果不正确,那就需要把那个正确的答案的路径输出来,看看有什么不同。

    结果发现最终答案应该是上下两个的差不超过2.

    于是我添加了一个 fix 函数,修正这种情况。

    然后三个样例都过了。

    再然后就是 WA 了。

    正确的题意

    然后我想还是想弄明白题意再说,于是用 [3,3; 2,2; 1,1] 模拟了一下,发现真的比 [3; 2; 1] 的答案的二倍少。

    这时我意识到可能目标真的是求[1,1; 2,2; 3,3]  这种情况。

    暴力DFS尝试

    知道了题意,数据量只是到8,于是写了一个暴力程序。

    使用 "1122334455" 串的形式map 了一下。

    对于5瞬间跑出答案,对于6 跑了好一会。

    双向DFS搜索

    直接搜太慢,那就双向搜试试。

    于是写了一个双向 DFS, 结果 6也是瞬间跑出来,但是 7 怎么也出不来了。

    使用逆序数剪枝双向搜索

    写的虽然是双向DFS,但是其实还是暴力搜索,还没有加什么剪枝。

    于是使用 逆序数剪枝, 7 十秒多跑出来了。

    于是提交试试,发现 超内存,现在不是时间问题了,是内存不够的问题了。

    状态压缩

    内存不够就要想法节省内存,其中 map<string, string>最浪费内存。

    为什么要使用 string 呢?

    为了保存一个状态。

    那能不能使用位数压缩状态么?

    发现还真的可以。

    数字是从1-8,也就是0-7 了。最少需要三位才能表示一个数字,总共需要 24位数字,3字节,long long 类型的可以。

    于是修改成map<LL, LL>.

    为什么要使用 map 呢?

    貌似是为了记录路径,这里不需要记录路径。

    于是修改成为了 set<LL> .

    再次提交还是超内存。

    A* 算法出世

    到底是为什么会超内存呢?

    因为状态太多了。

    为什么状态太多了呢?

    因为我们使用的暴力搜索,我们不知道哪个状态是最优解,哪个不是。

    那能不能确认某个状态一定比另一个状态更优呢?

    貌似可以的。

    那就用优先队列吧。

    于是问问学弟小堆是使用大于号还是小于号。最后自己在模板生找到了。

    A*搜索的估价函数

    双向搜索时曾遇到过逆序数,于是使用逆序数作为估价函数吧。

    7 终于跑出来了。

    但是 8 还是跑步出来。

    A*搜索的另一个估价函数

    逆序数这个估价函数行吗?

    貌似误差太大,无效状态太多。

    那能不能换一个估价函数呢?

    貌似还真有一个,每个数字离自己最终的位置的距离也是一个不错的估价汗是。

    那就使用这个估价函数吧。

    于是把估价函数换了换,结果还是只能跑出7来。

    强强联合

    怎么还是跑不出 8 呢?

    估价函数太弱,精度太低。

    那能不能加强估价函数呢?

    貌似可以的。

    比如说呢?

    对于逆序数,交换一次最多减少3个逆序数,最少一个。

    对于相对距离,交换一次最多减少两个,最少不变。

    知道了,就这个办呢。

    于是使用两个估计函数,重新了程序,结果7确实跑的快乐,但是还是跑不出8来。

    总结

    这道题虽然没有跑出 8 来,但是收获不少。

    首先这一切都是自己独立思考的,再次开发了智力。

    有兴趣的人可以继续思考下去,尽量不要看解题报告。

    所有代码都在这里 https://github.com/tiankonguse/ACM/tree/master/hust/doublesort

    参考

    tiankonguse 的模板

  • 相关阅读:
    Python -- Redis List
    Python --Redis Hash操作
    Python使用redis介绍
    缓存服务器
    linux python3获取ip地址
    Rabbitmq -- rpc
    Rabbitmq--topic
    Rabbitmq -- direct
    删除rabbitmq中持久化的队列和数据
    Exchange-fanout 广播模式
  • 原文地址:https://www.cnblogs.com/tiankonguse/p/3730639.html
Copyright © 2020-2023  润新知