LeetCode 3. Longest Substring Without Repeating Characters 無重複字符的最長子串 C#

前言

本文介紹了 LeetCode 第 3 題 , “Longest Substring Without Repeating Characters”, 也就是 “無重複字符的最長子串” 的問題.

本文使用 C# 語言完成題目,用到了 C# 的哈希表 HashSet 和 Dictionary ( 不用 HashTable 而是使用 Dictionary,官方推薦使用 Dictionary,詳情見 https://docs.microsoft.com/zh-cn/dotnet/api/system.collections.hashtable?view=netframework-4.8)。

題目

English

LeetCode 3. Longest Substring Without Repeating Characters

Given a string, find the length of the longest substring without repeating characters.

Example 1:

Input: “abcabcbb”
Output: 3
Explanation: The answer is “abc”, with the length of 3.
Example 2:

Input: “bbbbb”
Output: 1
Explanation: The answer is “b”, with the length of 1.
Example 3:

Input: “pwwkew”
Output: 3
Explanation: The answer is “wke”, with the length of 3.
Note that the answer must be a substring, “pwke” is a subsequence and not a substring.

中文

LeetCode 3. 無重複字符的最長子串

給定一個字符串,請你找出其中不含有重複字符的 最長子串 的長度。

示例 1:

輸入: “abcabcbb”
輸出: 3
解釋: 因爲無重複字符的最長子串是 “abc”,所以其長度爲 3。
示例 2:

輸入: “bbbbb”
輸出: 1
解釋: 因爲無重複字符的最長子串是 “b”,所以其長度爲 1。
示例 3:

輸入: “pwwkew”
輸出: 3
解釋: 因爲無重複字符的最長子串是 “wke”,所以其長度爲 3。
請注意,你的答案必須是 子串 的長度,“pwke” 是一個子序列,不是子串。

解決方案

按照一般邏輯來思考,可能需要3層循環來實現暴力破解,時間複雜度爲O(n^3) ;除了暴力破解外,還可以藉助哈希表實現O(n)的解決方案。

筆者爲大家整理了一下容易卡住的測試集 供大家參考。

1.  "a"
2. ""
3. "pwwkew"
4. "dvdf"
5. "abcd" 
6. "abcabcbb"

方法一 : 暴力法

逐個檢查所有的子字符串,看它是否不含有重複的字符。

需要用到3層循環計算,時間複雜度爲O(n^3).

C# 代碼 :

    public int LengthOfLongestSubstring(string s)
    {
        int result = 0;
        int i = 0;
        int j = 0;
        for (; i < s.Length; i++)
        {
            bool breakJ = false;
            for (j = i + 1; j < s.Length; j++)
            {
                for (int k = i; k < j; k++)
                {
                    if (s[k] == s[j])
                    {
                        int subResult = j - i;
                        result = subResult > result ? subResult : result;
                        breakJ = true;
                        i = k;
                        break;
                    }
                }
                if (breakJ) break;
            }
            if (!breakJ)
            {
                var subResult = j - i;
                result = subResult > result ? subResult : result;
                break;
            }
        }
        return result;
    }

執行結果

執行結果 通過,執行用時 520ms,內存消耗 27.3MB .

複雜度分析

時間複雜度:O(n^3)

空間複雜度:O(1)

思路圖解:

以 pwwkew 爲例:
在這裏插入圖片描述

時間複雜度的計算

在這裏插入圖片描述

方法二 : 滑動窗口

暴力法非常簡單,但它太慢了。那麼我們該如何優化它呢?

在暴力法中,我們會反覆檢查一個子字符串是否含有有重複的字符,但這是沒有必要的。如果從索引 i 到 j - 1 之間的子字符串 Sij 已經被檢查爲沒有重複字符。我們只需要檢查 s[j] 對應的字符是否已經存在於子字符串 Sij中。

要檢查一個字符是否已經在子字符串中,我們可以檢查整個子字符串,這將產生一個複雜度爲 O(n^2)的算法,但我們可以做得更好。

通過使用 HashSet 作爲滑動窗口,我們可以用 O(1) 的時間來完成對字符是否在當前的子字符串中的檢查。

滑動窗口是數組/字符串問題中常用的抽象概念。 窗口通常是在數組/字符串中由開始和結束索引定義的一系列元素的集合,即 [i, j)(左閉,右開)。而滑動窗口是可以將兩個邊界向某一方向“滑動”的窗口。例如,我們將 [i, j) 向右滑動 11 個元素,則它將變爲 [i+1, j+1)(左閉,右開)。

回到我們的問題,我們使用 HashSet 將字符存儲在當前窗口 [i, j)(最初 j = i)中。 然後我們向右側滑動索引 j,如果它不在 HashSet 中,我們會繼續滑動 j。直到 s[j] 已經存在於 HashSet 中。此時,得到一個局部解爲 s[i] 到 s[j-1] ,然後我們將 滑動窗口的左側向右移動,也就是 增加i,直到 HashSet 中沒有重複值位置。之後繼續將滑動窗口像右側滑動,增加 j 。循環以上步驟,取所有局部解的最大值,就得到我們的答案。

    public int LengthOfLongestSubstring(string s)
    {
        int n = s.Length;
        HashSet<char> set = new HashSet<char>();
        int result = 0;
        int i = 0;
        int j = 0;
        while (i < n && j < n)
        {
            if (set.Contains(s[j]))
            {
                set.Remove(s[i]);
                i++;
            }
            else
            {
                set.Add(s[j]);
                j++;
                result = Math.Max(result, j - i);
            }
        }
        return result;
    }

執行結果

執行結果 通過,執行用時 104ms,內存消耗 25.1MB .

複雜度分析

時間複雜度:O(2n) = O(n) ,最糟的情況下,每個字符將同時被 i 和 j 訪問,即每個字符被訪問2次。

空間複雜度:O(min(m,n)) ,與之前的方法相同。滑動窗口法需要 O(k) 的空間,其中 k 表示 Set 的大小。而 Set 的大小取決於字符串 n 的大小以及字符集 / 字母 m 的大小。

思路圖解:

以 pwwkew 爲例:

在這裏插入圖片描述

方法三 : 優化的滑動窗口

對於方法二,可以發現有一個地方可以優化的。方法二圖解的第三步到第四步,i 只向右移動了一格;即發生衝突時,i每次只會向右移動一格,這導致了在最糟糕的情況下,I 和 j 幾乎將 s 遍歷了一遍,共2n個步驟。

事實上,它可以被優化爲僅需要n個步驟。我們可以定義字符到索引的映射,而不是使用集合來判斷一個字符是否存在。 當我們找到重複的字符時,我們可以立即跳過該窗口。即對於方法二圖解的第四步來說,可以先找到與 s[j]重複的字符的下標index,讓窗口左側移動到 index+1 的位置即可。

C# 代碼中,我們不用之前的 HashSet , 而是改用 Dictionary:

    public int LengthOfLongestSubstring(string s)
    {
        int n = s.Length;
        Dictionary<char, int> map = new Dictionary<char, int>();
        int result = 0;
        int i = 0;
        int j = 0;
        while (j < n)
        {
            if (map.ContainsKey(s[j]))
            {
                var oldJ = map[s[j]];
                i = Math.Max(oldJ + 1, i);
                map[s[j]] = j;
            }
            else
            {
                map.Add(s[j], j);
            }
            j++;
            result = Math.Max(result, j - i);
        }
        return result;
    }

執行結果

執行結果 通過,執行用時 88ms,內存消耗 25.1MB .

複雜度分析

時間複雜度:O(n) , 索引 j 將會迭代 n 次,而索引 i 會在發生衝突時,立即跳到無衝突的位置。

空間複雜度:O(min(m,n)) ,與之前的方法相同。

參考資料彙總

https://leetcode-cn.com/problems/longest-substring-without-repeating-characters/

https://leetcode-cn.com/problems/longest-substring-without-repeating-characters/solution/wu-zhong-fu-zi-fu-de-zui-chang-zi-chuan-by-leetcod/

https://docs.microsoft.com/zh-cn/dotnet/api/system.collections.generic.hashset-1?view=netframework-4.8

https://docs.microsoft.com/zh-cn/dotnet/api/system.collections.generic.dictionary-2?view=netframework-4.8

https://docs.microsoft.com/zh-cn/dotnet/api/system.collections.hashtable?view=netframework-4.8

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章