英文版的面试10大算法汇总日最高访问量已高达4,318次。这说明总结程序员面试算法有实际意义,比读算法书更有效。下面是中文版的10大算法汇总+有代表性的题目汇总。这些概念是专门为面试准备的,因为日常编程中我们很少会自己去写一个链表或者做一个图,也不会经常使用没有效率的递归。
以下用Java角度解释面试常见的算法和数据结构:字符串,链表,树,图,排序,递归 vs. 迭代,动态规划,位操作,概率问题,排列组合,以及一些需要寻找规律的题目。
1. 字符串和数组
首先需要注意的是和C++不同,Java字符串不是char数组。没有IDE代码自动补全功能,应该记住下面的这些常用的方法。
toCharArray() //获得字符串对应的char数组 Arrays.sort() //数组排序 Arrays.toString(char[] a) //数组转成字符串 charAt(int x) //获得某个索引处的字符 length() //字符串长度 length //数组大小 substring(int beginIndex) substring(int beginIndex, int endIndex) Integer.valueOf() //string to integer String.valueOf() /integer to string
字符串和数组本身很简单,但是相关的题目需要更复杂的算法来解决。比如说动态规划,搜索,等等。
经典题目: Evaluate Reverse Polish Notation, Longest Palindromic Substring, Word Break, Word Ladder.
2. 链表
在Java中,链表的实现非常简单,每个节点Node都有一个值val和指向下个节点的链接next。
class Node { int val; Node next; Node(int x) { val = x; next = null; } }
链表两个著名的应用是栈Stack和队列Queue。在Java标准库都都有实现,一个是Stack,另一个是LinkedList(Queue是它实现的接口)。
经典题目: Add Two Numbers, Reorder List, Linked List Cycle, Copy List with Random Pointer.
3. 树
这里的树通常是指二叉树,每个节点都包含一个左孩子节点和右孩子节点,像下面这样:
class TreeNode{ int value; TreeNode left; TreeNode right; }
下面是与树相关的一些概念:
二叉搜索树:左结点 <= 中结点 <= 右结点
平衡 vs. 非平衡:平衡二叉树中,每个节点的左右子树的深度相差至多为1(1或0)。
满二叉树(Full Binary Tree):除叶子节点以为的每个节点都有两个孩子。
完美二叉树(Perfect Binary Tree):是具有下列性质的满二叉树:所有的叶子节点都有相同的深度或处在同一层次,且每个父节点都必须有两个孩子。
完全二叉树(Complete Binary Tree):二叉树中,可能除了最后一个,每一层都被完全填满,且所有节点都必须尽可能想左靠。
经典题目:Binary Tree Preorder Traversal , Binary Tree Inorder Traversal, Binary Tree Postorder Traversal,Word Ladder.
4. 图
图相关的问题主要集中在深度优先搜索(depth first search)和广度优先搜索(breath first search)。深度优先搜索很简单,广度优先要注意使用queue. 下面是一个简单的用队列Queue实现广度优先搜索。
public class GraphTest { public static void breathFirstSearch(GraphNode root, int x){ if(root.val == x) System.out.println("find in root"); Queue queue = new Queue(); root.visited = true; queue.enqueue(root); while(queue.first != null){ GraphNode c = (GraphNode) queue.dequeue(); for(GraphNode n: c.neighbors){ if(!n.visited){ System.out.print(n + " "); n.visited = true; if(n.val == x) System.out.println("Find "+n); queue.enqueue(n); } } } } }
5. 排序
下面是不同排序算法的时间复杂度,你可以去wiki看一下这些算法的基本思想。
Algorithm | Average Time | Worst Time | Space |
冒泡排序(Bubble sort) | n^2 | n^2 | 1 |
选择排序(Selection sort) | n^2 | n^2 | 1 |
插入排序(Insertion sort) | n^2 | n^2 | |
快速排序(Quick sort) | n log(n) | n^2 | |
归并排序(Merge sort) | n log(n) | n log(n) | depends |
* 另外还有BinSort, RadixSort和CountSort 三种比较特殊的排序。
经典题目: Mergesort, Quicksort, InsertionSort.
6. 递归 vs. 迭代
对程序员来说,递归应该是一个与生俱来的思想(a built-in thought),可以通过一个简单的例子来说明。
问题:
有n步台阶,一次只能上1步或2步,共有多少种走法。
步骤1:找到走完前n步台阶和前n-1步台阶之间的关系。
为了走完n步台阶,只有两种方法:从n-1步台阶爬1步走到或从n-2步台阶处爬2步走到。如果f(n)是爬到第n步台阶的方法数,那么f(n) = f(n-1) + f(n-2)。
步骤2: 确保开始条件是正确的。
f(0) = 0;
f(1) = 1;
public static int f(int n){ if(n <= 2) return n; int x = f(n-1) + f(n-2); return x; }
递归方法的时间复杂度是指数级,因为有很多冗余的计算:
f(5) f(4) + f(3) f(3) + f(2) + f(2) + f(1) f(2) + f(1) + f(1) + f(0) + f(1) + f(0) + f(1) f(1) + f(0) + f(1) + f(1) + f(0) + f(1) + f(0) + f(1)
直接的想法是将递归转换为迭代:
public static int f(int n) { if (n <= 2){ return n; } int first = 1, second = 2; int third = 0; for (int i = 3; i <= n; i++) { third = first + second; first = second; second = third; } return third; }
这个例子迭代花费的时间更少,你可能复习一个两者的区别Recursion vs Iteration。
7. 动态规划
动态规划是解决下面这些性质类问题的技术:
- 一个问题可以通过更小子问题的解决方法来解决,或者说问题的最优解包含了其子问题的最优解
- 有些子问题的解可能需要计算多次
- 子问题的解存储在一张表格里,这样每个子问题只用计算一次
- 需要额外的空间以节省时间
爬台阶问题完全符合上面的四条性质,因此可以用动态规划法来解决。
public static int[] A = new int[100]; public static int f3(int n) { if (n <= 2) A[n]= n; if(A[n] > 0) return A[n]; else A[n] = f3(n-1) + f3(n-2);//store results so only calculate once! return A[n]; }
8. 位操作
常用位操作符:
OR (|) | AND (&) | XOR (^) | Left Shift (<<) | Right Shift (>>) | Not (~) |
1|0=1 | 1&0=0 | 1^0=1 | 0010<<2=1000 | 1100>>2=0011 | ~1=0 |
用一个题目来理解这些操作 -
获得给定数字n的第i位:(i从0计数并从右边开始)
public static boolean getBit(int num, int i){ int result = num & (1<<i); if(result == 0){ return false; }else{ return true; }
例如,获得数字10的第2位:
i=1, n=10 1<<1= 10 1010&10=10 10 is not 0, so return true;
9. 概率问题
解决概率相关的问题通常需要先分析问题,下面是一个这类问题的简单例子:
一个房间里有50个人,那么至少有两个人生日相同的概率是多少?(忽略闰年的事实,也就是一年365天)
计算某些事情的概率很多时候都可以转换成先计算其相对面。在这个例子里,我们可以计算所有人生日都互不相同的概率,也就是:365/365 * 364/365 * 363/365 * … * (365-49)/365,这样至少两个人生日相同的概率就是1 – 这个值。
public static double caculateProbability(int n){ double x = 1; for(int i=0; i<n; i++){ x *= (365.0-i)/365.0; } double pro = Math.round((1-x) * 100); return pro/100; }
calculateProbability(50) = 0.97
10. 排列组合
组合和排列的区别在于次序是否关键。
11. 其他类型的题目
主要是不能归到上面10大类的。需要寻找规律,然后解决问题的。
经典题目: Reverse Integer
更新记录
算法汇总会不算更新,同时偶尔我会面试Google, Facebook, Amazon, Microsoft等等比较有名的公司,面经也会分享在这里。欢迎收藏本页。
微博:http://www.weibo.com/programcreek
12/06/2013 – 添加 “Add Two Numbers”, “Binary Tree Traversal(pre/in/post-order)”, “Find Single Number”,”Word Break”,”Reorder List”,”Edit Distance”, ” Reverse Integer”
12/14/2013 – 添加 “Copy List with Random Pointer”, “Evaluate Reverse Polish Notation”, “Word Ladder”.
引用:
1. Binary tree
2. Introduction to Dynamic Programming
3. UTSA Dynamic Programming slides
4. Birthday paradox
5. Cracking the Coding Interview: 150 Programming InterviewQuestions and Solutions, Gayle Laakmann McDowell
5. Counting sort
6. 感谢伯乐在线-敏敏的翻译
7. Top 10 Algorithms for Coding Interview