題:
給定一個字符串,請你找出其中不含有重複字符的 最長子串 的長度。
示例 1:
輸入: “abcabcbb”
輸出: 3
解釋: 因爲無重複字符的最長子串是 “abc”,所以其長度爲 3。
示例 2:
輸入: “bbbbb”
輸出: 1
解釋: 因爲無重複字符的最長子串是 “b”,所以其長度爲 1。
示例 3:
輸入: “pwwkew”
輸出: 3
解釋: 因爲無重複字符的最長子串是 “wke”,所以其長度爲 3。
請注意,你的答案必須是 子串 的長度,“pwke” 是一個子序列,不是子串。
來源:力扣(LeetCode)
鏈接:https://leetcode-cn.com/problems/longest-substring-without-repeating-characters
著作權歸領釦網絡所有。商業轉載請聯繫官方授權,非商業轉載請註明出處。
自己解:
class Solution {
public int lengthOfLongestSubstring(String s) {
List<String> list = new ArrayList();
for (int i = 0; i < s.length(); i++) {
String lastStr = "";
if (list.size() > 0) {
lastStr = list.get(list.size() == 0 ? 0 : list.size() - 1) == null ? "" : list.get(list.size() == 0 ? 0 : list.size() - 1);
}
String str = (lastStr.equals("") ? "" : lastStr.substring(lastStr.indexOf(s.substring(i, i + 1)) == -1 ? 0 : lastStr.indexOf(s.substring(i, i + 1)) + 1)) + s.substring(i, i + 1);
list.add(str);
}
int max = 0;
for (int i = 0; i < list.size(); i++) {
if (list.get(i).length() > max) {
max = list.get(i).length();
}
}
return max;
}
}
輸入:“abcabcbgadsfgadsdsfsewaqgab”
輸出:7
官方解:
方法一:暴力法
題目更新後由於時間限制,會出現 TLE。
思路
逐個檢查所有的子字符串,看它是否不含有重複的字符。
算法
假設我們有一個函數 boolean allUnique(String substring) ,如果子字符串中的字符都是唯一的,它會返回 true,否則會返回 false。 我們可以遍歷給定字符串 s 的所有可能的子字符串並調用函數 allUnique。 如果事實證明返回值爲 true,那麼我們將會更新無重複字符子串的最大長度的答案。
現在讓我們填補缺少的部分:
爲了枚舉給定字符串的所有子字符串,我們需要枚舉它們開始和結束的索引。假設開始和結束的索引分別爲 ii 和 jj。那麼我們有 0 \leq i \lt j \leq n0≤i<j≤n(這裏的結束索引 jj 是按慣例排除的)。因此,使用 ii 從 0 到 n - 1n−1 以及 jj 從 i+1i+1 到 nn 這兩個嵌套的循環,我們可以枚舉出 s 的所有子字符串。
要檢查一個字符串是否有重複字符,我們可以使用集合。我們遍歷字符串中的所有字符,並將它們逐個放入 set 中。在放置一個字符之前,我們檢查該集合是否已經包含它。如果包含,我們會返回 false。循環結束後,我們返回 true。
public class Solution {
public int lengthOfLongestSubstring(String s) {
int n = s.length();
int ans = 0;
for (int i = 0; i < n; i++)
for (int j = i + 1; j <= n; j++)
if (allUnique(s, i, j)) ans = Math.max(ans, j - i);
return ans;
}
public boolean allUnique(String s, int start, int end) {
Set<Character> set = new HashSet<>();
for (int i = start; i < end; i++) {
Character ch = s.charAt(i);
if (set.contains(ch)) return false;
set.add(ch);
}
return true;
}
}
複雜度分析
時間複雜度:O(n^3)O(n
3
) 。
要驗證索引範圍在 [i, j)[i,j) 內的字符是否都是唯一的,我們需要檢查該範圍中的所有字符。 因此,它將花費 O(j - i)O(j−i) 的時間。
對於給定的 i,對於所有 j \in [i+1, n]j∈[i+1,n] 所耗費的時間總和爲:
\sum_{i+1}^{n}O(j - i)
i+1
∑
n
O(j−i)
因此,執行所有步驟耗去的時間總和爲:
O\left(\sum_{i = 0}^{n - 1}\left(\sum_{j = i + 1}^{n}(j - i)\right)\right) = O\left(\sum_{i = 0}^{n - 1}\frac{(1 + n - i)(n - i)}{2}\right) = O(n^3)
O(
i=0
∑
n−1
(
j=i+1
∑
n
(j−i)))=O(
i=0
∑
n−1
2
(1+n−i)(n−i)
)=O(n
3
)
空間複雜度:O(min(n, m))O(min(n,m)),我們需要 O(k)O(k) 的空間來檢查子字符串中是否有重複字符,其中 kk 表示 Set 的大小。而 Set 的大小取決於字符串 nn 的大小以及字符集/字母 mm 的大小。
方法二:滑動窗口
算法
暴力法非常簡單,但它太慢了。那麼我們該如何優化它呢?
在暴力法中,我們會反覆檢查一個子字符串是否含有有重複的字符,但這是沒有必要的。如果從索引 ii 到 j - 1j−1 之間的子字符串 s_{ij}s
ij
已經被檢查爲沒有重複字符。我們只需要檢查 s[j]s[j] 對應的字符是否已經存在於子字符串 s_{ij}s
ij
中。
要檢查一個字符是否已經在子字符串中,我們可以檢查整個子字符串,這將產生一個複雜度爲 O(n^2)O(n
2
) 的算法,但我們可以做得更好。
通過使用 HashSet 作爲滑動窗口,我們可以用 O(1)O(1) 的時間來完成對字符是否在當前的子字符串中的檢查。
滑動窗口是數組/字符串問題中常用的抽象概念。 窗口通常是在數組/字符串中由開始和結束索引定義的一系列元素的集合,即 [i, j)[i,j)(左閉,右開)。而滑動窗口是可以將兩個邊界向某一方向“滑動”的窗口。例如,我們將 [i, j)[i,j) 向右滑動 11 個元素,則它將變爲 [i+1, j+1)[i+1,j+1)(左閉,右開)。
回到我們的問題,我們使用 HashSet 將字符存儲在當前窗口 [i, j)[i,j)(最初 j = ij=i)中。 然後我們向右側滑動索引 jj,如果它不在 HashSet 中,我們會繼續滑動 jj。直到 s[j] 已經存在於 HashSet 中。此時,我們找到的沒有重複字符的最長子字符串將會以索引 ii 開頭。如果我們對所有的 ii 這樣做,就可以得到答案。
Java
public class Solution {
public int lengthOfLongestSubstring(String s) {
int n = s.length();
Set<Character> set = new HashSet<>();
int ans = 0, i = 0, j = 0;
while (i < n && j < n) {
// try to extend the range [i, j]
if (!set.contains(s.charAt(j))){
set.add(s.charAt(j++));
ans = Math.max(ans, j - i);
}
else {
set.remove(s.charAt(i++));
}
}
return ans;
}
}
複雜度分析
時間複雜度:O(2n) = O(n)O(2n)=O(n),在最糟糕的情況下,每個字符將被 ii 和 jj 訪問兩次。
空間複雜度:O(min(m, n))O(min(m,n)),與之前的方法相同。滑動窗口法需要 O(k)O(k) 的空間,其中 kk 表示 Set 的大小。而 Set 的大小取決於字符串 nn 的大小以及字符集 / 字母 mm 的大小。
方法三:優化的滑動窗口
上述的方法最多需要執行 2n 個步驟。事實上,它可以被進一步優化爲僅需要 n 個步驟。我們可以定義字符到索引的映射,而不是使用集合來判斷一個字符是否存在。 當我們找到重複的字符時,我們可以立即跳過該窗口。
也就是說,如果 s[j]s[j] 在 [i, j)[i,j) 範圍內有與 j’j
′
重複的字符,我們不需要逐漸增加 ii 。 我們可以直接跳過 [i,j’][i,j
′
] 範圍內的所有元素,並將 ii 變爲 j’ + 1j
′
+1。
Java(使用 HashMap)
Java
public class Solution {
public int lengthOfLongestSubstring(String s) {
int n = s.length(), ans = 0;
Map<Character, Integer> map = new HashMap<>(); // current index of character
// try to extend the range [i, j]
for (int j = 0, i = 0; j < n; j++) {
if (map.containsKey(s.charAt(j))) {
i = Math.max(map.get(s.charAt(j)), i);
}
ans = Math.max(ans, j - i + 1);
map.put(s.charAt(j), j + 1);
}
return ans;
}
}
Java(假設字符集爲 ASCII 128)
以前的我們都沒有對字符串 s 所使用的字符集進行假設。
當我們知道該字符集比較小的時侯,我們可以用一個整數數組作爲直接訪問表來替換 Map。
常用的表如下所示:
int [26] 用於字母 ‘a’ - ‘z’ 或 ‘A’ - ‘Z’
int [128] 用於ASCII碼
int [256] 用於擴展ASCII碼
Java
public class Solution {
public int lengthOfLongestSubstring(String s) {
int n = s.length(), ans = 0;
int[] index = new int[128]; // current index of character
// try to extend the range [i, j]
for (int j = 0, i = 0; j < n; j++) {
i = Math.max(index[s.charAt(j)], i);
ans = Math.max(ans, j - i + 1);
index[s.charAt(j)] = j + 1;
}
return ans;
}
}
複雜度分析
時間複雜度:O(n)O(n),索引 jj 將會迭代 nn 次。
空間複雜度(HashMap):O(min(m, n))O(min(m,n)),與之前的方法相同。
空間複雜度(Table):O(m)O(m),mm 是字符集的大小。
作者:LeetCode
鏈接:https://leetcode-cn.com/problems/longest-substring-without-repeating-characters/solution/wu-zhong-fu-zi-fu-de-zui-chang-zi-chuan-by-leetcod/
來源:力扣(LeetCode)