ruby 1,9 多字節字符

ruby 1.9

 

String類

 

length 與 size 方法返回字符數

bytesize 方法返回字節數

 

encoding方法返回字符串的編碼方式

 

force_encoding方法顯示地設置一個字符串的編碼方式,注:它不改變底層的字節

 

text = stram.readline.force_encoding("utf-8)
bytes = text.dup.force_encoding(nil)
 

foce_encoding不做任何驗證工作,可以使用valid_encoding?來進行驗證

 

s = "\xa4".force_coding("utf-8")  # This is not a valid utf-8 string
s.valid_encoding?               # false

 

encode方法,給一個字符串進行編碼,但是它改變了其字符串的底層字節\

 

s.encode("utf-8")
s.encode("iso-8859-15")

 

如果要在一些未經編碼的字節組成上的字符串上調用encoding方法,那麼你須要傳遞兩個參數給encode,

第一個參數表示所期待的編碼

第二個參數表示字符的當前編碼

byte = "\xA4"
chat = byte.encode("utf-8', "iso-8859-15")

 

 

 

 

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章