std::string類詳解

std::string類詳解

之所以拋棄char*的字符串而選用C++標準程序庫中的string類,是因爲他和前者比較起來,不必 擔心內存是否足夠、字符串長度等等,而且作爲一個類出現,他集成的操作函數足以完成我們大多數情況下(甚至是100%)的需要。我們可以用 = 進行賦值操作,== 進行比較,+ 做串聯(是不是很簡單?)。我們儘可以把它看成是C++的基本數據類型。

標準模板庫(STL)提供了一個std::string類,其是std::basic_string的一個特化,它是一個容器類,可把字符串當作普通類型來使用,並支持比較、連接、遍歷、STL算法、複製、賦值等等操作,這個類定義在<string>頭文件中。

#include <string> //注意這裏不是string.h string.h是C字符串頭文件
1.聲明一個C++字符串
std::string類的構造函數

聲明一個字符串變量很簡單:
string Str;
這樣我們就聲明瞭一個字符串變量,但既然是一個類,就有構造函數和析構函數。上面的聲明沒有傳入參數,所以就直接使用了string的默認的構造函數,這個函數所作的就是把Str初始化爲一個空字符串。String類的構造函數和析構函數如下:
a) string s(); //生成一個空字符串s
b) string s(str) //拷貝構造函數 生成str的複製品string(const string& str)
c) string s(str,stridx) //將字符串str內"始於位置stridx"的部分當作字符串的初值
d) string s(const string& str, size_type pos,strlen) //將字符串str內"始於pos且長度頂多strlen"的部分作爲字符串的初值
e) string s(const char *s) //將C字符串作爲s的初值
f) string s(const char* cstr, size_type n) //使用字符串str的前n個字符初始化作爲字符串s的初值。
g) string s(int num,char c) //生成一個字符串,包含num個c字符
h) string s(beg,end) //以區間beg;end(不包含end)內的字符作爲字符串s的初值
i) s.~string() //銷燬所有字符,釋放內存
都很簡單,我就不解釋了。

當構造的string太長而無法表達時會拋出length_error異常


2.字符串操作函數
這裏是C++字符串的重點,我先把各種操作函數羅列出來,不喜歡把所有函數都看完的人可以在這裏找自己喜歡的函數,再到後面看他的詳細解釋。
a) =,assign() //賦以新值
b) swap() //交換兩個字符串的內容
c) +=,append(),push_back() //在尾部添加字符
d) insert() //插入字符
e) erase(int nStart,int nEnd) //刪除nStart—nEnd位置字符
f) clear() //刪除全部字符
g) replace() //替換字符
h) + //串聯字符串
i) ==,!=,<,<=,>,>=,compare() //比較字符串
j) size(),length() //返回字符數量
k) max_size() //返回字符的可能最大個數
l) empty() //判斷字符串是否爲空
m) capacity() //返回重新分配之前的字符容量
n) reserve() //保留一定量內存以容納一定數量的字符
o) [ ], at() //存取單一字符
p) >>,getline() //從stream讀取某值
q) << //將謀值寫入stream
r) copy() //將某值賦值爲一個C_string
s) c_str() //將內容以C_string返回
t) data() //將內容以字符數組形式返回
u) substr() //返回某個子字符串
v)查找函數
w)begin() end() //提供類似STL的迭代器支持
x) rbegin() rend() //逆向迭代器
y) get_allocator() //返回配置器
下面詳細介紹:

2.1 C++字符串和C字符串的轉換
C ++提供的由C++字符串得到對應的C_string的方法是使用data()、c_str()和copy(),其中,data()以字符數組的形式返回字符串內容,但並不添加’’。c_str()返回一個以‘’結尾的字符數組,而copy()則把字符串的內容複製或寫入既有的c_string或 字符數組內。C++字符串並不以’’結尾。我的建議是在程序中能使用C++字符串就使用,除非萬不得已不選用c_string。由於只是簡單介紹,詳細介紹掠過,誰想進一步瞭解使用中的注意事項可以給我留言(到我的收件箱)。我詳細解釋。

2.2 大小和容量函數
一個C++字符 串存在三種大小:

a) 現有的字符數,函數是size()和length(),他們等效。Empty()用來檢查字符串是否爲空。

b) max_size() 這個大小是指當前C++字符串最多能包含的字符數,很可能和機器本身的限制或者字符串所在位置連續內存的大小有關係。我們一般情況下不用關心他,應該大小足夠我們用的。但是不夠用的話,會拋出length_error異常

c) capacity()重新分配內存之前 string所能包含的最大字符數。這裏另一個需要指出的是reserve()函數,這個函數爲string重新分配內存。重新分配的大小由其參數決定, 默認參數爲0,這時候會對string進行非強制性縮減。

還有必要再重複一下C++字符串和C字符串轉換的問 題,許多人會遇到這樣的問題,自己做的程序要調用別人的函數、類什麼的(比如數據庫連接函數Connect(char*,char*)),但別人的函數參 數用的是char*形式的,而我們知道,c_str()、data()返回的字符數組由該字符串擁有,所以是一種const char*,要想作爲上面提及的函數的參數,還必須拷貝到一個char*,而我們的原則是能不使用C字符串就不使用。那麼,這時候我們的處理方式是:如果 此函數對參數(也就是char*)的內容不修改的話,我們可以這樣Connect((char*)UserID.c_str(), (char*)PassWD.c_str()),但是這時候是存在危險的,因爲這樣轉換後的字符串其實是可以修改的(有興趣地可以自己試一試),所以我強調除非函數調用的時候不對參數進行修改,否則必須拷貝到一個char*上去。當然,更穩妥的辦法是無論什麼情況都拷貝到一個char*上去。同時我們也祈 禱現在仍然使用C字符串進行編程的高手們(說他們是高手一點兒也不爲過,也許在我們還穿開襠褲的時候他們就開始編程了,哈哈…)寫的函數都比較規範,那樣 我們就不必進行強制轉換了。
2.3元素存取

我們可以使用下標操作符[]和函數at()對元素包含的字符進行訪問。但是應該注意的是操作符[]並不檢查索引是否有效(有效索引0~str.length()),如果索引失效,會引起未定義的行爲。而at()會檢查,如果使用 at()的時候索引無效,會拋出out_of_range異常。
有一個例外不得不說,const string a;的操作符[]對索引值是a.length()仍然有效,其返回值是’’。其他的各種情況,a.length()索引都是無效的。舉例如下:
const string Cstr("const string");
string Str("string");

Str[3]; //ok
Str.at(3); //ok

Str[100]; //未定義的行爲
Str.at(100); //throw out_of_range

Str[Str.length()] //未定義行爲
Cstr[Cstr.length()] //返回 ‘’
Str.at(Str.length());//throw out_of_range
Cstr.at(Cstr.length()) ////throw out_of_range

我不贊成類似於下面的引用或指針賦值:
char& r=s[2];
char* p= &s[3];
因爲一旦發生重新分配,r,p立即失效。避免的方法就是不使用。


遍歷所有字符,這可由C風格的索引或STL迭代子來完成(如果無需修改,應使用const_iterator)。

std::string name = "marius";

for(size_t i = 0; i < name.length(); ++i)

std::cout << name[i];

 

for(std::string::const_iterator cit = name.begin(); cit != name.end(); ++cit)

std::cout << *cit;

 

for(std::string::iterator it = name.begin();it != name.end(); ++it)

*it = toupper(*it);
2.4比較函數
C ++字符串支持常見的比較操作符(>,>=,<,<=,==,!=),甚至支持string與C-string的比較(如 str<"hello")。在使用>,>=,<,<=這些操作符的時候是根據"當前字符特性"將字符按字典順序進行逐一得 比較。字典排序靠前的字符小,比較的順序是從前向後比較,遇到不相等的字符就按這個位置上的兩個字符的比較結果確定兩個字符串的大小。同時,string ("aaaa") <string(aaaaa)。
另一個功能強大的比較函數是成員函數compare()。他支持多參數處理,支持用索引值和長度定位子串來進行比較。他返回一個整數來表示比較結果,返回值意義如下:0-相等 〉0-大於 <0-小於。舉例如下:
string s("abcd");

s.compare("abcd"); //返回0
s.compare("dcba"); //返回一個小於0的值
s.compare("ab"); //返回大於0的值

s.compare(s); //相等
s.compare(0,2,s,2,2); //用"ab"和"cd"進行比較 小於零
s.compare(1,2,"bcx",2); //用"bc"和"bc"比較。
怎麼樣?功能夠全的吧!什麼?還不能滿足你的胃口?好吧,那等着,後面有更個性化的比較算法。先給個提示,使用的是STL的比較算法。什麼?對STL一竅不通?靠,你重修吧!

2.5 更改內容
這在字符串的操作中佔了很大一部分。

首先講賦值,第一個賦值方法當然是使用操作符=,新值可以是string(如:s=ns) 、c_string(如:s="gaint")甚至單一字符(如:s=’j’)。還可以使用成員函數assign(),這個成員函數可以使你更靈活的對字符串賦值。還是舉例說明吧:
s.assign(str); //不說
s.assign(str,1,3);//如果str是"iamangel" 就是把"ama"賦給字符串
s.assign(str,2,string::npos);//把字符串str從索引值2開始到結尾賦給s
s.assign("gaint"); //不說
s.assign("nico",5);//把’n’ ‘I’ ‘c’ ‘o’ ‘’賦給字符串
s.assign(5,’x’);//把五個x賦給字符串
把字符串清空的方法有三個:s="";s.clear();s.erase();(我越來越覺得舉例比說話讓別人容易懂!)。
string提供了很多函數用於插入(insert)、刪除(erase)、替換(replace)、增加字符。
先說增加字符(這裏說的增加是在尾巴上),函數有 +=、append()、push_back()。舉例如下:
s+=str;//加個字符串
s+="my name is jiayp";//加個C字符串
s+=’a’;//加個字符

s.append(str);
s.append(str,1,3);//不解釋了 同前面的函數參數assign的解釋
s.append(str,2,string::npos)//不解釋了

s.append("my name is jiayp");
s.append("nico",5);
s.append(5,’x’);
2.5.1、在字符串結尾插入其他元素。
s.push_back(‘a’);//這個函數只能增加單個字符 對STL熟悉的理解起來很簡單
2.5.2、 在指定位置插入字符串或字符。

也許你需要在string中間的某個位置插入字符串,這時候你可以用insert()函數,這個函數需要你指定一個安插位置的索引,被插入的字符串將放在這個索引的後面。
s.insert(0,"my name");
s.insert(1,str);
這 種形式的insert()函數不支持傳入單個字符,這時的單個字符必須寫成字符串形式(讓人噁心)。既然你覺得噁心,那就不得不繼續讀下面一段話:爲了插 入單個字符,insert()函數提供了兩個對插入單個字符操作的重載函數:insert(size_type index,size_type num,chart c)和insert(iterator pos,size_type num,chart c)。其中size_type是無符號整數,iterator是char*,所以,你這麼調用insert函數是不行的:insert(0,1, ’j’);這時候第一個參數將轉換成哪一個呢?所以你必須這麼寫:insert((string::size_type)0,1,’j’)!第二種形式指 出了使用迭代器安插字符的形式,在後面會提及。順便提一下,string有很多操作是使用STL的迭代器的,他也儘量做得和STL靠近。
刪除函數erase()的形式也有好幾種(真煩!),替換函數replace()也有好幾個。舉例吧:
string s="il8n";
s.replace(1,2,"nternationalizatio");//從索引1開始的2個替換成後面的C_string

2.5.3、 刪除字符串的某一部分。
s.erase(13);//從索引13開始往後全刪除
s.erase(7,5);//從索引7開始往後刪5個

2.6提取子串和字符串連接
題取子串的函數是:substr(),形式如下:
s.substr();//返回s的全部內容
s.substr(11);//從索引11往後的子串
s.substr(5,6);//從索引5開始6個字符
把兩個字符串結合起來的函數是+。(誰不明白請致電120)

2.7輸入輸出操作
1.>> 從輸入流讀取一個string。
2.<< 把一個string寫入輸出流。
另一個函數就是getline(),他從輸入流讀取一行內容,直到遇到分行符或到了文件尾。

2.8搜索與查找

std::string類的查找函數
查找函數很多,功能也很強大,包括了:
find()
rfind()
find_first_of()
find_last_of()
find_first_not_of()
find_last_not_of()

 
這些函數返回符合搜索條件的字符區間內的第一個字符的索引,沒找到目標就返回npos。所有的函數的參數說明如下:
第一個參數是被搜尋的對象。第二個參數(可有可無)指出string內的搜尋起點索引,第三個參數(可有可無)指出搜尋的字符個數。比較簡單,不多說不理解的可以向我提出,我再仔細的解答。當然,更加強大的STL搜尋在後面會有提及。
最 後再說說npos的含義,string::npos的類型是string::size_type,所以,一旦需要把一個索引與npos相比,這個索引值必須是string::size)type類型的,更多的情況下,我們可以直接把函數和npos進行比較(如:if(s.find("jia")== string::npos))。

3.1、使用STL算法

 

std::string name = "marius";

// 使字符串全爲大寫

std::transform(name.begin(), name.end(), name.begin(),toupper);

std::string name = "marius";

// 升序排列字符串

std::sort(name.begin(), name.end());

std::string name = "marius";

// 反轉字符串

std::reverse(name.begin(), name.end());

bool iswhitespace(char ch)

{

return  ch == ' ' || ch == 't' || ch == 'v' ||

ch == 'r' || ch == 'n';

}

 

std::string name = " marius  ";

// 刪除空白字符

std::string::iterator newend = std::remove_if(name.begin(), name.end(), iswhitespace);

name.erase(newend);

 

 

std::string類的替換函數

 

函數1:
std::string & replace(size_type pos1, size_type n1, const std::string & str, size_type pos2 = 0, size_type n2 = npos);

該函數的作用:使用str字符串從位置pos2開始的n2個字符,替換當前字符串從pos1位置開始處的n1個字符。
可以這樣理解:該函數將當前字符串從pos1開始的n1個字符全部刪除,然後再用str整個字符串或者str從pos2開始的n2個字符,從pos1位置開始填入到當前字符串中。

提醒:如果n1或者n2的數值超出了對應字符串的長度,以實際長度爲準,不會出現訪問越界的情況。

注意:
a、如果pos1指定的位置超出當前字符串的範圍,拋出std::out_of_range異常,不捕捉將導致coredump。
b、如果pos2指定的位置超出替換字符串str的範圍,拋出std::out_of_range異常,不捕捉將導致coredump。

函數2:
std::string& replace(size_type pos, size_type n1, const char * s, size_type n2);

該函數的作用:使用字符串s的前n2個字符,替換當前字符串從pos位置開始處的n1個字符。
可以這樣理解:函數將當前字符串從pos開始的n1個字符全部刪除,然後再用字符串s的前n2個字符填入到當前字符串中。類似於函數1的pos2等於0,必須指定n2的這種情況,但也有一點的差別,下面會注意裏描述這種差別。
注意:
a、如果pos指定的位置超出當前字符串的範圍,拋出std::out_of_range異常,不捕捉將導致coredump。
b、該函數不會判斷字符串s和n2的大小關係,它嚴格地從s起始處拷貝n2個字符到指定位置。如果n2表示的長度超出了s的範圍,它會讀取s後面的內存空間,有可能會因爲內存訪問越界而coredump。但函數1的n2可以超出範圍,它以實際長度爲準。

函數3:
std::string& replace(size_type pos, size_type n1, const char* s);

該函數的作用:使用以''爲結尾的字符串s,替換當前字符串從pos位置開始處的n1個字符。
可以這樣理解:函數將當前字符串從pos開始的n1個字符全部刪除,然後再用字符串s從開始到以''結束的所有字符,從pos位置開始填入到當前字符串中。

注意:如果pos指定的位置超出當前字符串的範圍,拋出std::out_of_range異常,不捕捉將導致coredump。

函數4:
std::string& replace(size_type pos, size_type n1, size_type n2, char c);

該函數的作用:使用n2個c表示的字符,替換當前字符串從pos位置開始處的n1個字符。
可以這麼理解:函數將當前字符串從pos開始的n1個字符全部刪除,然後再用n2個c字符,從pos位置開始填入到當前字符串中。

注意:如果pos指定的位置超出當前字符串的範圍,拋出std::out_of_range異常,不捕捉將導致coredump。

函數5:
std::string& replace(iterator i1, iterator i2, const std::string& str);

該函數的作用:使用字符串str,替換當前字符串[i1,i2)之間的字符。

函數6:
std::string& replace(iterator i1, iterator i2, const char* s, size_type n);

該函數的作用:使用字符串s的前n個字符,替換當前字符串[i1,i2)之間的字符。

函數7:
std::string& replace(iterator i1, iterator i2, const char* s);

該函數的作用:使用以''結尾的字符串s,替換當前字符串[i1,i2)之間的字符。

函數8:
std::string& replace(iterator i1, iterator i2, size_type n, char c);

該函數的作用:使用n個c表示的字符,替換當前字符串[i1,i2)之間的字符。

std::string類的內部類型定義

typedef traits traits_type;

typedef typename traits::char_type value_type;

typedef size_t size_type;

typedef Allocator allocator_type;

typedef ptrdiff_t difference_type;

typedef Allocator allocator_type;

typedef Allocator allocator_type;

typedef Allocator allocator_type;

typedef charT& reference; typedef const charT& const_reference; typedef charT* pointer; typedef const charT* const_pointer; typedef pointer iterator; typedef const_pointer const_iterator; typedef ::reverse_iterator reverse_iterator; typedef ::reverse_iterator const_reverse_iterator; static const size_type npos = static_cast(-1);

std::string類的賦值運算符

string& operator= (const char* s);
string& operator= (char c);
string& operator+= (const string& rhs);
string& operator+= (const char* s);
string& operator+= (char c);
string operator+ (const string & lhs, const string & rhs);
string operator+ (const char* lhs, const string & rhs);
string operator+ (char lhs, const string & rhs);
string operator+ (const string & lhs, const char* rhs);
string operator+ (const string & lhs, char rhs);

std::string類的邏輯運算符

bool operator== (const string & lhs, const string & rhs);
bool operator== (const char* lhs, const string & rhs);
bool operator== (const string & lhs, const char* rhs);
bool operator!= (const string & lhs, const string & rhs);
bool operator!= (const char* lhs, const string & rhs);
bool operator!= (const string & lhs, const char* rhs);
bool operator< (const string & lhs, const string & rhs);
bool operator< (const char* lhs, const string & rhs);
bool operator< (const string & lhs, const char* rhs);
bool operator> (const string & lhs, const string & rhs);
bool operator> (const char* lhs, const string & rhs);
bool operator> (const string & lhs, const char* rhs);
bool operator

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章