sscanf函數講解

#include<stdio.h>

 定義函數 int sscanf (const char *str,const char * format,........);

 sscanf()會將參數str的字符串根據參數format字符串來轉換並格式化數據。格式轉換形式請參考scanf()。轉換後的結果存於對應的參數內。

scanf以及sscanf實際上是支持部分正則表達式的,sscanf提供的這個擴展功能其實並不能真正稱爲正則表達式,因爲他的書寫還是離不開%,而且也很侷限。sscanf的這個擴展功能支持[]表示支付範圍,{}表示重複次數,^表示取非,*表示跳過。

說明:
  sscanf與scanf類似,都是用於輸入的,只是後者以屏幕(stdin)爲輸入源,前者以固定字符串爲輸入源。
  其中的format可以是一個或多個 {%[*] [width] [{h | l | I64 | L}]type | ' ' | '\t' | '\n' | 非%符號}
  注:
  1、 * 亦可用於格式中, (即 %*d 和 %*s) 加了星號 (*) 表示跳過此數據不讀入. (也就是不把此數據讀入參數中)
  2、{a|b|c}表示a,b,c中選一,[d],表示可以有d也可以沒有d。
  3、width表示讀取寬度。
  4、{h | l | I64 | L}:參數的size,通常h表示單字節size,I表示2字節 size,L表示4字節size(double例外),l64表示8字節size。
  5、type :這就很多了,就是%s,%d之類。
  6、特別的:%*[width] [{h | l | I64 | L}]type 表示滿足該條件的被過濾掉,不會向目標參數中寫入值

  支持集合操作:
  %[a-z] 表示匹配a到z中任意字符,貪婪性(儘可能多的匹配)
  %[aB'] 匹配a、B、'中一員,貪婪性
  %[^a] 匹配非a的任意字符,貪婪性
舉例:
char url[] = "dv://192.168.1.253:65001/1/1"
sscanf(url,"%[^://]%*c%*c%*c%[^:]%*c%d%*c%d%*c%d",protocol,ip,port,chn,type);

解釋一下

先取得一個最長的字符串,但不包括字串://,於是protocol="dv\0";

然後跳過三個字符(%*c),其實就是跳過://

接着取一個字符串不包括字符串:,於是ip=192.168.1.253,這裏簡化處理了,IP就當個字符串來弄,而且不做檢查

然後跳過冒號取端口到port,再跳過/取通道號到chn,再跳過/取碼流類型到type。

      是不是覺得還不過癮?我也覺得,接着舉例。

sscanf("Phil\nChang","%[^\n]%*c%s",first_name,last_name);

解釋:跳過一個換行符,取first_name和last_name

實驗1:

sscanf( "123456" , "%s" , str) ; ---------str的值爲 "123456/0!!!"

這個實驗很簡單,把源字符串"123456"拷貝到str的前6個字符,並且把str的第7個字符設爲null字符,也就是/0

實驗2:

sscanf( "123456" , "%3s" , str) ; ---------str的值爲 "123/0!!!!!!"

看到沒有,正則表達式的百分號後面多了一個3,這告訴sscanf只拷貝3個字符給str,然後把第4個字符設爲null字符。

實驗3:

sscanf( "aaaAAA" , "%[a-z]" , str) ; ---------str的值爲 "aaa/0!!!!!!"

從這個實驗開始我們會使用正則表達式,括號裏面的a-z就是一個正則表達式,它可以表示從a到z的任意字符,

在 繼續討論之前,我們先來看看百分號表示什麼意思,%表示選擇 ,%後面的是條件,比如實驗1的"%s",s是一個條件,表示任意字符,"%s"的意思是:只 要輸入的東西是一個字符,就把它拷貝給str。實驗2的"%3s"又多了一個條件:只拷貝3個字符。實驗3的“%[a-z]”的條件稍微嚴格一些,輸入的 東西不但是字符,還得是一個小寫字母的字符,所以實驗3只拷貝了小寫字母"aaa"給str,別忘了加上null字符。

實驗4:

sscanf( "AAAaaaBBB" , "%[^a-z]" , str) ; ---------str的值爲 "AAA/0!!!!!!"

對 於所有字符,只要不是小寫字母,都滿足"^a-z"正則表達式,符號^表示邏輯非。前3個字符都不是小寫字符,所以將其拷貝給str,但最後3個字符也不 是小寫字母,爲什麼不拷貝給str呢?這是因爲當碰到不滿足條件的字符後,sscanf就會停止執行,不再掃描之後的字符。

實驗5:

sscanf( "AAAaaaBBB" , "%[A-Z]%[a-z]" , str) ; ---------段錯誤

這 個實驗的本意是:先把大寫字母拷貝給str,然後把小寫字母拷貝給str,但很不幸,程序運行的時候會發生段錯誤,因爲當sscanf掃描到字符a時,違 反了條件"%[A-Z]",sscanf就停止執行,不再掃描之後的字符,所以第二個條件也就沒有任何意義,這個實驗說明:不能使用%號兩次或兩次以上

實驗6:

sscanf( "AAAaaaBBB" , "%*[A-Z]%[a-z]" , str) ; ---------str的值爲 "aaa/0!!!!!!"

這 個實驗出現了一個新的符號:%*,與%相反,%*表示過濾 滿足條件的字符,在這個實驗中,%*[A-Z]過濾了所有大寫字母,然後再使用%[a-z]把之 後的小寫字母拷貝給str。如果只有%*,沒有%的話,sscanf不會拷貝任何字符到str,這時sscanf的作用僅僅是過濾字符串。

實驗7:

sscanf( "AAAaaaBBB" , "%[a-z]" , str) ; ---------str的值爲 "!!!!!!!!!!"

做完前面幾個實驗後,我們都知道sscanf拷貝完成後,還會在str的後面加上一個null字符,但如果沒有一個字符滿足條件,sscanf不會在str的後面加null字符,str的值依然是10個驚歎號。這個實驗也說明了,如果不使用%*過濾掉前面不需要的字符,你永遠別想取得中間的字符。 

實驗8:

sscanf( "AAAaaaBC=" , "%*[A-Z]%*[a-z]%[^a-z=]" , str) ; ---------str的值爲 "BC/0!!!!!!!"

這是一個綜合實驗,但這個實驗的目的不是幫我們複習前面所學的知識,而是展示兩個值得注意的地方:

注意1:%只能使用一次,但%*可以使用多次,比如在這個實驗裏面,先用%*[A-Z]過濾大寫字母,然後用%*[a-z]過濾小寫字母。

注意2:^後面可以帶多個條件,且這些條件都受^的作用,比如^a-z=表示^a-z且^=(既不是小寫字母,也不是等於號)。

實驗9:

int k;

sscanf( "AAA123BBB456" "%*[^0-9]%i" &k) ; ---------k的值爲123

首先,%*[^0-9]過濾前面非數字的字符,然後用%i把數字字符轉換成int型的整數,拷貝到變量k,注意參數必須使用k的地址。

例子: 
  1. 常見用法。 
  char buf[512] = ; 
  sscanf("123456 ", "%s", buf); 
  printf("%s\n", buf); 
  結果爲:123456 
  2. 取指定長度的字符串。如在下例中,取最大長度爲4字節的字符串。 
  sscanf("123456 ", "%4s", buf); 
  printf("%s\n", buf); 
  結果爲:1234 
  3. 取到指定字符爲止的字符串。如在下例中,取遇到空格爲止字符串。 
  sscanf("123456 abcdedf", "%[^ ]", buf); 
  printf("%s\n", buf); 
  結果爲:123456 
  4. 取僅包含指定字符集的字符串。如在下例中,取僅包含1到9和小寫字母的字符串。 
  sscanf("123456abcdedfBCDEF", "%[1-9a-z]", buf); 
  printf("%s\n", buf); 
  結果爲:123456abcdedf 
  5. 取到指定字符集爲止的字符串。如在下例中,取遇到大寫字母爲止的字符串。 
  sscanf("123456abcdedfBCDEF", "%[^A-Z]", buf); 
  printf("%s\n", buf); 
  結果爲:123456abcdedf 
  6、給定一個字符串iios/12DDWDFF@122,獲取 / 和 @ 之間的字符串,先將 "iios/"過濾掉,再將非'@'的一串內容送到buf中 
  sscanf("iios/12DDWDFF@122", "%*[^/]/%[^@]", buf); 
  printf("%s\n", buf); 
  結果爲:12DDWDFF 
  7、給定一個字符串““hello, world”,僅保留world。(注意:“,”之後有一空格) 
  sscanf(“hello, world”, "%*s%s", buf); 
  printf("%s\n", buf); 
  結果爲:world 
  %*s表示第一個匹配到的%s被過濾掉,即hello被過濾了 
  如果沒有空格則結果爲NULL。 
  sscanf的功能很類似於正則表達式, 但卻沒有正則表達式強大,所以如果對於比較複雜的字符串處理,建議使用正則表達式. 
  //------------------------------------------------------- 
  sscanf,表示從字符串中格式化輸入 
  上面表示從str中,輸入數字給x,就是32700 
  久以前,我以爲c沒有自己的split string函數,後來我發現了sscanf;一直以來,我以爲sscanf只能以空格來界定字符串,現在我發現我錯了。 
  sscanf是一個運行時函數,原形很簡單: 
  int sscanf( 
  const char *buffer, 
  const char *format [, 
  argument ] ... 
  ); 
  它強大的功能體現在對format的支持上。 
  我以前用它來分隔類似這樣的字符串2006:03:18: 
  int a, b, c; 
  sscanf("2006:03:18", "%d:%d:%d", a, b, c); 
  以及2006:03:18 - 2006:04:18: 
  char sztime1[16] = "", sztime2[16] = ""; 
  sscanf("2006:03:18 - 2006:04:18", "%s - %s", sztime1, sztime2); 
  但是後來,我需要處理2006:03:18-2006:04:18 
  僅僅是取消了‘-’兩邊的空格,卻打破了%s對字符串的界定。 
  我需要重新設計一個函數來處理這樣的情況?這並不複雜,但是,爲了使所有的代碼都有統一的風格,我需要改動很多地方,把已有的sscanf替換成我自己的分割函數。我以爲我肯定需要這樣做,並伴隨着對sscanf的強烈不滿而入睡;一覺醒來,發現其實不必。 
  format-type中有%[]這樣的type field。如果讀取的字符串,不是以空格來分隔的話,就可以使用%[]。 
  %[]類似於一個正則表達式。[a-z]表示讀取a-z的所有字符,[^a-z]表示讀取除a-z以外的所有字符。 
  所以那個問題也就迎刃而解了: 
  sscanf("2006:03:18 - 2006:04:18", "%[0-9,:] - %[0-9,:]", sztime1, sztime2); 
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章