Longest Substring Without Repeating Characters

今天的题目是：

Given a string, find the length of the longest substring without repeating characters.

Examples:

Given "abcabcbb", the answer is "abc", which the length is 3.

Given "bbbbb", the answer is "b", with the length of 1.

Given "pwwkew", the answer is "wke", with the length of 3. Note that the answer must be a substring, "pwke" is a subsequence and not a substring.

翻译一下：给一个字符串，找到无重复字符的最长子字符串的长度。

例如：字符串“abcabcbb”,答案是“abc”的长度为3。字符串“bbbbb”,答案是“b”的长度为1。字符串“pwwkew”,答案是“wke”的长度为3。要注意的是答案必须是子字符串，“pwke”是子序列并不是一个子字符串。

　　第一种解法：也是我能想到的最笨的方法，遍历。第一层从i = 0开始，第二层从 j = i + 1开始，每次判断从 i 到 j 的子字符串是否有重复字符，如果有，直接返回，如果没有，得出子字符串的长度，与之前的长度作比较取出最大值，作为最新的答案，循环结束后返回这个值。

package com.test;

import java.util.HashSet;
import java.util.Set;

public class Test {
    
    @org.junit.Test
    public void test(){
        String s = "pwwkew";//未考虑空字符串
        int length = 1;
        for(int i = 0;i < s.length()-1;i++){
            for(int j = i+1;j < s.length(); j++){
                if(isNotRepeating(s,i,j))
                    length = Math.max(j-i+1, length);
            }
        }
        System.out.println(s + "的最大子字符串长度为" + length);
    }
    
    public boolean isNotRepeating(String s,int start,int end){
        Set<Character> set = new HashSet<Character>();
        for(int i = start;i <= end;i++){
            Character ch = s.charAt(i);
            if(set.contains(ch)){
                return false;
            }else{
                set.add(ch);
            }
        }
        return true;
    }
}

结果：

时间复杂度：O（N^3）。为了验证下标为i，j的字符集是否无重复，我们需要遍历它们，因此，这就花费了O（j-i）时间。对每一个i,花费时间为

　　第二种解法：这种解法我也想过，但是我考虑的是用队列，这肯定耗时间。在第一种解法中，我们需要重复检查子字符串中是否有重复的字符。但是这并不是必须的。对于从i到j-1的子字符串已经检查了无重复的字符，我们下一步仅需要检查s[j]是否已经在从i到j-1的子字符串中。回到我们的问题，我们使用HashSet来存储字符集[i,j-1)，然后我们检查下标为j的字符是否已经在[i,j-1)中存在。如果未存在，我们就把s[j]加入到HashSet中，然后得到了当前无重复子字符串的最大长度，如果已存在，就把s[i]从HashSet中删除（从头开始删除，是不是像队列）。

package com.test;

import java.util.HashSet;
import java.util.Set;

public class Test {
    
    @org.junit.Test
    public void test(){
        String s = "pwwkew";//未考虑空字符串
        System.out.println(s + "的最大子字符串长度为" + getLongestSubStringLength(s));
    }
    
    public int getLongestSubStringLength(String s){
        int length = 1,m = 0,n = 0;//非空字符串的不重复子字符串长度最小为1
        int size = s.length();
        HashSet<Character> set = new HashSet<Character>();
        while(m < size && n < size){
            if(!set.contains(s.charAt(m))){
                set.add(s.charAt(m));
                length = Math.max(length, m-n+1);
                m++;
            }else{
                set.remove(s.charAt(n++));
            }
        }
        return length;
    }
}

结果：

时间复杂度：O（2n）= O（n）。

空间复杂度：

　　第三种解法：这种解法是对第二种解法的优化，事实上，它可以优化到只需要n步。我们不再使用set，而是使用map，将字符与其下标关联起来，这样当我们碰到重复字符时可以立刻定位到重复字符的下标。例如我们在[i,j)找到了与s[j]相同字符的下标k，这是我们不需要一步步加i，即i++，此时我们可以直接跳过，使i = k。

package com.test;

import java.util.HashMap;
import java.util.HashSet;
import java.util.Map;
import java.util.Set;

public class Test {
    
    @org.junit.Test
    public void test(){
        String s = "pwwkew";//未考虑空字符串
        System.out.println(s + "的最大子字符串长度为" + getLongestSubStringLength(s));
    }
    
    public int getLongestSubStringLength(String s){
        int length = 1,n = 0;//非空字符串的不重复子字符串长度最小为1
        int size = s.length();
        Map<Character,Integer> map = new HashMap<Character,Integer>();
        for(int m = 0;m < size;m++){
            if(map.containsKey(s.charAt(m))){
                n = Math.max(n, map.get(s.charAt(m)));
                //map.remove(map.get(s.charAt(m)));//这个条件可以不加，加的话，下面的put相当于新添；不加的话下面的put是更新
            }
            length = Math.max(length, m-n);//计算下标为n到m的长度，但是不包括n，所以不用加1
            map.put(s.charAt(m), m);
        }
        return length;
    }
}

时间复杂度：O（n）。

空间复杂度：

public class Solution {
    public int lengthOfLongestSubstring(String s) {
        int n = s.length(), ans = 0;
        int[] index = new int[128]; // current index of character
        // try to extend the range [i, j]
        for (int j = 0, i = 0; j < n; j++) {
            i = Math.max(index[s.charAt(j)], i);
            ans = Math.max(ans, j - i + 1);
            index[s.charAt(j)] = j + 1;
        }
        return ans;
    }
}

此时的时间复杂度为O(n），空间复杂度为常量O(m),m为字符集的数量，例如上面的128。

身体是革命的本钱，爱跑步，爱生活！

相关阅读:
bzoj 2178 圆的面积并 —— 辛普森积分
 hdu 1724 Ellipse —— 自适应辛普森积分
 洛谷 P4525 & P4526 [模板] 自适应辛普森积分
 bzoj 4530 大融合 —— LCT维护子树信息
 bzoj 3083 遥远的国度 —— 树链剖分
 CF 360 E Levko and Game —— 贪心+最短路
 「网络流24题」 9. 方格取数问题
 「网络流24题」 17. 运输问题
 [Luogu 1533] 可怜的狗狗
 「网络流24题」 2. 太空飞行计划问题
原文地址：https://www.cnblogs.com/caozx/p/8613512.html