• 程序员面试常问的小算法总结


    在这里插入图片描述

    前言

    本文快速回顾了面试常考的算法,用作面试复习,事半功倍。

    需要说明的是,由于算法的代码实现主要注重思路的清晰,下方有代码实现的文章主要以Python为主,Java为辅,对于Python薄弱的同学敬请不用担心,几乎可以看作是伪代码,可读性比较好。如实在有困难可以自行搜索Java代码

    此外,关于算法的文章之后也会单独开设算法专栏进行总结,敬请期待。

    面试知识点复习手册

    全复习手册文章导航

    全复习手册文章导航(CSDN)

    已发布知识点复习手册

    -----正文开始-----

    图的最短路径算法

    Floyd最短路算法(多源最短路)

    参考:https://www.cnblogs.com/ahalei/p/3622328.html

    在这里插入图片描述

    上图中有4个城市8条公路,公路上的数字表示这条公路的长短。请注意这些公路是单向的。我们现在需要求任意两个城市之间的最短路程,也就是求任意两个点之间的最短路径。这个问题这也被称为“多源最短路径”问题。

    现在需要一个数据结构来存储图的信息,我们仍然可以用一个4*4的矩阵(二维数组e)来存储。

    在这里插入图片描述

    核心代码:

    for(k=1;k<=n;k++)
        for(i=1;i<=n;i++)
            for(j=1;j<=n;j++)
                if(e[i][j]>e[i][k]+e[k][j])
                     e[i][j]=e[i][k]+e[k][j];
    

    这段代码的基本思想就是:

    最开始只允许经过1号顶点进行中转,接下来只允许经过1和2号顶点进行中转……允许经过1~n号所有顶点进行中转,求任意两点之间的最短路程。用一句话概括就是:从i号顶点到j号顶点只经过前k号点的最短路程。

    Dijkstra最短路算法(单源最短路)

    参考:http://blog.51cto.com/ahalei/1387799

    指定一个点(源点)到其余各个顶点的最短路径,也叫做“单源最短路径”。例如求下图中的1号顶点到2、3、4、5、6号顶点的最短路径。

    在这里插入图片描述

    仍然使用二维数组e来存储顶点之间边的关系,初始值如下。

    在这里插入图片描述

    我们还需要用一个一维数组dis来存储1号顶点到其余各个顶点的初始路程,如下。

    在这里插入图片描述

    将此时dis数组中的值称为最短路的“估计值”。

    既然是求1号顶点到其余各个顶点的最短路程,那就先找一个离1号顶点最近的顶点。通过数组dis可知当前离1号顶点最近是2号顶点。当选择了2号顶点后,dis[2]的值就已经从“估计值”变为了“确定值”,即1号顶点到2号顶点的最短路程就是当前dis[2]值。

    既然选了2号顶点,接下来再来看2号顶点有哪些出边呢。有2->3和2->4这两条边。先讨论通过2->3这条边能否让1号顶点到3号顶点的路程变短。也就是说现在来比较dis[3]和dis[2]+e[2][3]的大小。其中dis[3]表示1号顶点到3号顶点的路程。dis[2]+e[2][3]中dis[2]表示1号顶点到2号顶点的路程,e[2][3]表示2->3这条边。所以dis[2]+e[2][3]就表示从1号顶点先到2号顶点,再通过2->3这条边,到达3号顶点的路程。

    这个过程有个专业术语叫做“松弛”。松弛完毕之后dis数组为:

    在这里插入图片描述

    接下来,继续在剩下的3、4、5和6号顶点中,选出离1号顶点最近的顶点4,变为确定值,以此类推。

    在这里插入图片描述

    最终dis数组如下,这便是1号顶点到其余各个顶点的最短路径。

    在这里插入图片描述

    //Dijkstra算法核心语句
        for(i=1;i<=n-1;i++)
        {
            //找到离1号顶点最近的顶点
            min=inf;
            for(j=1;j<=n;j++)
            {
                if(book[j]==0 && dis[j]<min)
                {
                    min=dis[j];
                    u=j;
                }
            }
            book[u]=1;
            for(v=1;v<=n;v++)
            {
                if(e[u][v]<inf)
                {
                    if(dis[v]>dis[u]+e[u][v])
                        dis[v]=dis[u]+e[u][v];
                }
            }
        }
    
    • M:边的数量

    • N:节点数量

    通过上面的代码我们可以看出,这个算法的时间复杂度是O(N^2)。其中每次找到离1号顶点最近的顶点的时间复杂度是O(N)

    优化:

    • 这里我们可以用“堆”(以后再说)来优化,使得这一部分的时间复杂度降低到O(logN)。

    • 另外对于边数M少于N2的稀疏图来说(我们把M远小于N2的图称为稀疏图,而M相对较大的图称为稠密图),我们可以用邻接表来代替邻接矩阵,使得整个时间复杂度优化到O( (M+N)logN)。

    • 请注意!在最坏的情况下M就是N2,这样的话MlogN要比N2还要大。但是大多数情况下并不会有那么多边,因此(M+N)logN要比N2小很多。

    用邻接表代替邻接矩阵存储

    参考:http://blog.51cto.com/ahalei/1391988

    略微难懂,请参考原文

    总结如下:

    可以发现使用邻接表来存储图的时间空间复杂度是O(M),遍历每一条边的时间复杂度是也是O(M)。如果一个图是稀疏图的话,M要远小于N^2。因此稀疏图选用邻接表来存储要比邻接矩阵来存储要好很多。

    汉诺塔

    参考图例:https://www.zhihu.com/question/24385418/answer/89435529

    关键代码:

    def move(n,a,b,c):
        if n == 1:
            print(a, "--->", c)
        else:
            move(n-1,a,c,b)
            print(a, "--->", c)
            move(n-1,b,a,c)
    

    杨辉三角

    参考:https://blog.csdn.net/zmy_3/article/details/51173580

    关键代码(巧用python中的yield):

    注释:N加上一个0之后,最后一个数是1+0,直接就等于1,不会有0

    def triangles():
        N=[1]
        while True:
            yield N
            N.append(0)
            N=[N[i-1] + N[i] for i in range(len(N))]
            
    n=0
    for t in triangles():
        print(t)
        n=n+1
        if n == 10:
            break
    

    回文数/回文串

    解法一:暴力

    return a == a[::-1]
    

    解法二:分字符串和数字

    # 字符串/数字
    a = len(s)
    i = 0
    while i <= (a/2):
        if s[i] == s[a-1-i]:
            i += 1
        else:
            return False
    return True
    
    # 数字
    def isPalindrome(x):
            if x < 0:
                return False
            temp = x 
            y = 0 
            while temp:
                y = y*10 + temp%10
                temp /= 10
            return x == y
    

    斐波拉契数列(Fibonacci)

    def fibonacci():  # 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89
        f = [0] * MAXSIZE
        f[0] = 1
        f[1] = 1
        for i in range(2, MAXSIZE):
            f[i] = f[i-1] + f[i-2]
        return f
    
    fibs = [1,1]  
    for i in range(8):
        fibs.append(fibs[-2] + fibs[-1])
    

    最大子序列与最大子矩阵问题

    数组的最大子序列问题

    给定一个数组,其中元素有正,也有负,找出其中一个连续子序列,使和最大。

    参考自己的博客:https://blog.csdn.net/qqxx6661/article/details/78167981

    可以理解为动态规划:

    dp[i] = dp[i-1] + s[i] (dp[i-1] >= 0)
    dp[i] = s[i] (dp[i-1] < 0)
    

    可以用标准动态规划求解也可以用直接方法求解,但思路都是动态规划

    最大子矩阵问题

    给定一个矩阵(二维数组),其中数据有大有小,请找一个子矩阵,使得子矩阵的和最大,并输出这个和。

    参考:https://blog.csdn.net/kavu1/article/details/50547401

    思路:

    原始矩阵可以是二维的。假设原始矩阵是一个3 * n 的矩阵,那么它的子矩阵可以是 1 * k, 2 * k, 3 * k,(1 <= k <= n)。 如果是1*K,这里有3种情况:子矩阵在第一行,子矩阵在第二行,子矩阵在第三行。如果是 2 * k,这里有两种情况,子矩阵在第一、二行,子矩阵在第二、三行。如果是3 * k,只有一种情况。

    为了能够找出最大的子矩阵,我们需要考虑所有的情况。假设这个子矩阵是 2 * k, 也就是说它只有两行,要找出最大子矩阵,我们要从左到右不断的遍历才能找出在这种情况下的最大子矩阵。如果我们把这两行上下相加,情况就和求“最大子段和问题” 又是一样的了。

    KMP算法

    原理参考:

    http://www.ruanyifeng.com/blog/2013/05/Knuth–Morris–Pratt_algorithm.html

    移动位数 = 已匹配的字符数 - 对应的部分匹配值

    "部分匹配值"就是"前缀"和"后缀"的最长的共有元素的长度。以"ABCDABD"为例,

    - "A"的前缀和后缀都为空集,共有元素的长度为0;
    
    - "AB"的前缀为[A],后缀为[B],共有元素的长度为0;
    
    - "ABC"的前缀为[A, AB],后缀为[BC, C],共有元素的长度0;
    
    - "ABCD"的前缀为[A, AB, ABC],后缀为[BCD, CD, D],共有元素的长度为0;
    
    - "ABCDA"的前缀为[A, AB, ABC, ABCD],后缀为[BCDA, CDA, DA, A],共有元素为"A",长度为1;
    
    - "ABCDAB"的前缀为[A, AB, ABC, ABCD, ABCDA],后缀为[BCDAB, CDAB, DAB, AB, B],共有元素为"AB",长度为2;
    
    - "ABCDABD"的前缀为[A, AB, ABC, ABCD, ABCDA, ABCDAB],后缀为[BCDABD, CDABD, DABD, ABD, BD, D],共有元素的长度为0。
    

    实现参考自己的博客:

    https://blog.csdn.net/qqxx6661/article/details/79583707

    LCS/最长公共子序列/最长公共子串

    参考自己的博客:

    https://blog.csdn.net/qqxx6661/article/details/79587392

    最长公共子序列LCS

    动态规划状态转移方程式

    在这里插入图片描述

    最长公共回文子串

    动态规划状态转移方程式

    在这里插入图片描述

    求圆周率

    在这里插入图片描述

    from random import random
    from math import  sqrt
    from time import clock  #计算程序运行时间
    DARTS=1200   #抛洒点的个数
    #DARTS=5000
    #DARTS=20000
    #DARTS=1000000
    hists=0    #抛洒点在1/4(半径为1)圆内点的个数
    clock()
    for i in range(1,DARTS):
        x,y=random(),random()
        dict=sqrt(x**2+y**2)
        if dict<=1.0:
            hists=hists+1    #随机设点,若抛洒点在1/4圆内,则dice+1
    pi=4*(hists/DARTS)
    print("PI的值是 %s" %pi)
    print("程序运行的时间是 %-5.5ss" %clock())
    

    大数问题(加减乘除)

    加法

    对应位置相加,考虑进位,前面不够补0

    L1 = "2649821731631836529481632803462831616487712734074314936141303241873417434716340124362304724324324324324323412121323164329751831"
    L2 = "1045091731748365195814509145981509438583247509149821493213241431431319999999999999999999999999999999999999999999999999341344779"
    
    # 长度强行扭转到一致,不够前面补0
    max_len = len(L1) if len(L1) > len(L2) else len(L2)
    l1 = L1.zfill(max_len)
    l2 = L2.zfill(max_len)
    
    a1 = list(l1)
    a2 = list(l2)
    
    # 99+99最大3位所以多一位
    result_list = [0] * (max_len + 1)
    
    # 长度一致 每个对应的位置的相加的和 %10 前一位补1 如果>10 否则0  
    for index in range(max_len - 1, -1, -1):
        index_sum = result_list[index + 1] + int(a1[index]) + int(a2[index])
        less = index_sum - 10
        result_list[index + 1] = index_sum % 10
        result_list[index] = 1 if less >= 0 else 0
        
    # 若第一位为0,去除
    if result_list[0] == 0:
        result_list.pop(0)
    
    # 转为str的list
    result = [str(i) for i in result_list]
    print(''.join(result))
    

    减法

    和相加十分类似

    就是按照我们手写除法时的方法,两个数字末位对齐,从后开始,按位相减,不够减时向前位借一。
    最终结果需要去除首端的0.如果所有位都是0,则返回0。

    乘法

    大数乘法问题及其高效算法:

    https://blog.csdn.net/u010983881/article/details/77503519

    方法:

    1. 模拟小学乘法:最简单的乘法竖式手算的累加型;

    自己实现的:https://blog.csdn.net/qqxx6661/article/details/78119074

    1. 分治乘法:最简单的是Karatsuba乘法,一般化以后有Toom-Cook乘法;

    见下方

    1. 快速傅里叶变换FFT:(为了避免精度问题,可以改用快速数论变换FNTT),时间复杂度O(N lgN lglgN)。具体可参照Schönhage–Strassen algorithm;
    2. 中国剩余定理:把每个数分解到一些互素的模上,然后每个同余方程对应乘起来就行;
    3. Furer’s algorithm:在渐进意义上FNTT还快的算法。不过好像不太实用,本文就不作介绍了。大家可以参考维基百科

    方法2:

    参考:

    https://blog.csdn.net/jeffleo/article/details/53446095

    Karatsuba乘法(公式和下面代码实现的不同,但是原理相同,可以直接背下方代码)

    在这里插入图片描述

    核心语句:

    long z2 = karatsuba(a, c);
    long z0 = karatsuba(b, d);
    long z1 = karatsuba((a + b), (c + d)) - z0 - z2;
    
    return (long)(z2 * Math.pow(10, (2*halfN)) + z1 * Math.pow(10, halfN) + z0);
    

    完整代码:

    /**
     * Karatsuba乘法
     */
    public static long karatsuba(long num1, long num2){
        //递归终止条件
        if(num1 < 10 || num2 < 10) return num1 * num2;
    
        // 计算拆分长度
        int size1 = String.valueOf(num1).length();
        int size2 = String.valueOf(num2).length();
        int halfN = Math.max(size1, size2) / 2;
    
        /* 拆分为a, b, c, d */
        long a = Long.valueOf(String.valueOf(num1).substring(0, size1 - halfN));
        long b = Long.valueOf(String.valueOf(num1).substring(size1 - halfN));
        long c = Long.valueOf(String.valueOf(num2).substring(0, size2 - halfN));
        long d = Long.valueOf(String.valueOf(num2).substring(size2 - halfN));
    
        // 计算z2, z0, z1, 此处的乘法使用递归
        long z2 = karatsuba(a, c);
        long z0 = karatsuba(b, d);
        long z1 = karatsuba((a + b), (c + d)) - z0 - z2;
    
        return (long)(z2 * Math.pow(10, (2*halfN)) + z1 * Math.pow(10, halfN) + z0);
    }
    

    除法

    Leetcode原题(用位运算加速了手动除法)

    https://blog.csdn.net/qqxx6661/article/details/79723357

    为了加速运算,可以依次将被除数减去1,2,4,8,..倍的除数,本质上只是用位运算加速了手动除法

    计算机计算乘除法的原理

    位运算除法

    https://blog.csdn.net/zdavb/article/details/47108505

    最小生成树

    图解Prim算法和Kruskal算法:

    https://www.cnblogs.com/biyeymyhjob/archive/2012/07/30/2615542.html

    两种方法的时间复杂度

    Prim:

    这里记顶点数v,边数e

    • 邻接矩阵:O(v2)
    • 邻接表:O(elog2v)

    Kruskal:

    elog2e e为图中的边数

    # coding=utf-8
    import sys
    
    
    class Graph(object):
        def __init__(self, maps):
            self.maps = maps
            self.nodenum = self.get_nodenum()
            self.edgenum = self.get_edgenum()
    
        def get_nodenum(self):
            return len(self.maps)
    
        def get_edgenum(self):
            count = 0
            for i in range(self.nodenum):
                for j in range(i):
                    if self.maps[i][j] > 0 and self.maps[i][j] < 9999:
                        count += 1
            return count
    
        def kruskal(self):
            res = []
            if self.nodenum <= 0 or self.edgenum < self.nodenum - 1:
                return res
            edge_list = []
            for i in range(self.nodenum):
                for j in range(i, self.nodenum):
                    if self.maps[i][j] < 9999:
                        edge_list.append([i, j, self.maps[i][j]])  # 按[begin, end, weight]形式加入
            edge_list.sort(key=lambda a: a[2])  # 已经排好序的边集合
    
            group = [[i] for i in range(self.nodenum)]
            for edge in edge_list:
                for i in range(len(group)):
                    if edge[0] in group[i]:
                        m = i
                    if edge[1] in group[i]:
                        n = i
                if m != n:
                    res.append(edge)
                    group[m] = group[m] + group[n]
                    group[n] = []
            return res
    
        def prim(self):
            res = []
            if self.nodenum <= 0 or self.edgenum < self.nodenum - 1:
                return res
            res = []
            seleted_node = [0]
            candidate_node = [i for i in range(1, self.nodenum)]
    
            while len(candidate_node) > 0:
                begin, end, minweight = 0, 0, 9999
                for i in seleted_node:
                    for j in candidate_node:
                        if self.maps[i][j] < minweight:
                            minweight = self.maps[i][j]
                            begin = i
                            end = j
                res.append([begin, end, minweight])
                seleted_node.append(end)
                candidate_node.remove(end)
            return res
    
    if __name__ == "__main__":
        # 读取第一行的n
        n = int(sys.stdin.readline().strip(''))
        cun_list = list(map(int,sys.stdin.readline().strip('').split(' ')))
        dp = [[0 for __ in range(n)] for __ in range(n)]
        for i in range(n):
            for j in range(n):
                if i == j:
                    dp[i][j] = 0
                    continue
                dp[i][j] = max(cun_list[i],cun_list[j])
    
    
        print(dp)
    
        graph = Graph(dp)
        # print('邻接矩阵为
    %s' % graph.maps)
        # print('节点数据为%d,边数为%d
    ' % (graph.nodenum, graph.edgenum))
        # print('------最小生成树kruskal算法------')
        # print(graph.kruskal())
        # print('------最小生成树prim算法')
        # print(graph.prim())
        print()
    

    -----正文结束-----

    关注我

    我是蛮三刀把刀,目前为后台开发工程师。主要关注后台开发,网络安全,Python爬虫等技术。

    来微信和我聊聊:yangzd1102

    Github:https://github.com/qqxx6661

    原创博客主要内容

    • 笔试面试复习知识点手册
    • Leetcode算法题解析(前150题)
    • 剑指offer算法题解析
    • Python爬虫相关技术分析和实战
    • 后台开发相关技术分析和实战

    同步更新以下博客

    1. Csdn

    http://blog.csdn.net/qqxx6661

    拥有专栏:Leetcode题解(Java/Python)、Python爬虫开发、面试助攻手册

    2. 知乎

    https://www.zhihu.com/people/yang-zhen-dong-1/

    拥有专栏:码农面试助攻手册

    3. 掘金

    https://juejin.im/user/2119514149109095

    4. 简书

    https://www.jianshu.com/u/b5f225ca2376

    个人公众号:Rude3Knife

    个人公众号:Rude3Knife

    如果文章对你有帮助,不妨收藏起来并转发给您的朋友们~

  • 相关阅读:
    Vue.js
    Spark Streaming自定义Receiver
    Hive UDF函数
    HBase表预分区与压缩
    Hive映射HBase表的几种方式
    Spark源码阅读之存储体系--存储体系概述与shuffle服务
    Spark Streaming实时写入数据到HBase
    基于Spark的用户行为路径分析
    Spark Streaming消费Kafka Direct方式数据零丢失实现
    CountDownLatch如何使用
  • 原文地址:https://www.cnblogs.com/rude3knife/p/13493065.html
Copyright © 2020-2023  润新知