今天在一場“特殊的討論”中引入了一個問題,如何在C#求出字符串中某字符的出現次數,比如求“ADSFGEHERGASDF”中“A”出現的次數。首先想到的方法當然是從頭遍歷字符串並統計:
c1 = 0;
for (int i = 0; i < str.Length; i++)
{
if (str[i] == 'A')
{
c1++;
}
}
第二種方法也很容易想到,將字符串中所有要查找的字符去除,然後比較去除前後的字符串長度即可。這種方法遭到了某人的鄙視,據說性能很差而且多佔空間。
c2 = str.Length - str.Replace("A", String.Empty).Length;
接下來某人又提出了第三種方法,是用要查找的字符爲分隔符,將原字符串分隔爲多個子串,然後求子串的數目即可。在C#中這是一個寫起來很短的方法:
c3 = str.Split(new char[] { 'A' }).Length - 1;
我們從原理可以推斷出三者性能的順序,但究竟差距是多少呢,還是要動手試驗一下。這是非常經典的測試代碼:
string str = "SADTHDGSAFSDGTGHRDGSADFADDRHDFSGASDAA";
Stopwatch sw = new Stopwatch();
long t;
int c = 0;
GC.Collect();
Application.DoEvents();
sw.Start();
for (int i = 0; i < 100000; i++)
{
c = 三種算法
}
sw.Stop();
t = sw.ElapsedMilliseconds;
首先我們確保正確性,經測試三種方法都能正確處理多種情況,包括首尾、連續出現、不出現或串長度爲0等,我所取的字符串是一個很普通的串。編譯爲Release版,預運行10次後獲得以下結果:
遍歷統計:13毫秒
替換後比較長度:112毫秒
斷開字符串後計數:233毫秒
這裏已經體現出差異,遍歷統計比替換後比較要快10倍,斷開字符串又要慢一些。接下來我又做了如下兩個測試:
1、不改變字符串的長度,增加或減少要查找字符串的個數。
2、不改變要查找字符出現的頻率,但增長字符串的長度。
結果發現,三種方法都隨字符串長度增加線性變慢,而後兩種方法還隨要查找的字符增加而變慢。斷開字符串的方法還受要查找字符串分佈情況的影響。
研究Replace函數和Split函數的實現可以徹底解決這個問題。不過我沒有心情細細研究了,我還是決定選用第二種方法——替換後比較長度。雖然其速度比第一種方法慢,但易於改寫爲求長度不爲1的子串出現次數的方法。第一種方法若改爲求長度大於1的字串就要考慮很多因素(儘管不一定真的很麻煩),我懶得想了,呵呵。
打印 | posted on 2004年11月23日 18:08 | Filed Under [ 技術隨筆 ] | 收藏本頁 (百度搜藏)(QQ書籤)(Live收藏)(Google書籤)(Yahoo書籤)(新浪ViVi)(搜狐網摘)(365Key網摘)(天極網摘)(博採網摘)(和訊網摘)
href="http://blog.joycode.com/ninputer/Services/Pingback.aspx" rel="pingback" />
反饋
if (str[i] == 'A')
{
c1++;
}
比較改爲strncmp,然後i=i+子串長度即可,
:-)
很多方法要做字符串長度判斷或者邊界條件判斷,如此簡單又不是特別需要性能的地方就從簡考慮哈
畢竟效率不是唯一考慮的因素。
不尊重我的知識產權,你更要請客了
這樣所有其它的方法必然比1的方法效率低.
應爲不論採用什麼方法都要識別出待查找的字符串,這樣已經可以計數了呀,爲什麼還要做別的事?
當然邊界條件是每個程序都應該考慮的.
爲什麼我用以下代碼反而最費時,而且字符串越長,性能差異越明顯,遠不及Replace快,甚至比不上Spilit
int c = 0;
for (int i = 0; i < sourceString.Length-childString.Length+1; i++)
{
if (string.Compare(sourceString,i,childString,0,childString.Length) == 0)
{
c++;
i += childString.Length;
}
}
不過自己寫的
int c = 0;
for (int i = 0; i < sourceString.Length-childString.Length+1; i++)
{
int iMatch = 0;
for (int j = 0; j < childString.Length; j++)
{
if (sourceString[i + iMatch] != childString[j])
{
break;
}
else
{
iMatch++;
}
}
if (iMatch == childString.Length)
{
c++;
i += childString.Length;
}
}
倒是比string.Compare快,不過還是不及Replace
迷惑。。。。。。。
for (int i = 0; i < sourceString.Length-childString.Length+1; i++)
可以換成
int Slen = sourceString.Length;
int Clen = childString.Length;
for (int i = 0; i < Slen -Clen +1; i++)
{
}