一、python中文編碼問題
其實python對中文的支持很好。不過需要注意下面這兩個問題:
一個是python源文件的編碼,再有一個是python中的字符串string類型的編碼。這兩種類型的編碼默認都是ASCII,所以如果你的源文件中有中文就會報錯。
要將源文件的編碼修改可以這樣:
在文件的第一或第二行,寫上下面的任意一行
#coding=utf8
#-*- coding=utf8 -*-
這樣源文件就可以保存中文了。但是使用string的相應函數處理中文時,也會遇到編碼的錯誤,因爲string類型默認也是ASCII,因此需要使用下面的語句來改變string的編碼。
import sys
reload(sys)
sys.setdefaultencoding(‘utf8′)
二、查看字符串有哪些函數
help(str)
三、python使用hash函數
hashlib是個專門提供hash算法的庫,現在裏面包括md5, sha1, sha224, sha256, sha384, sha512,使用非常簡單、方便。 md5經常用來做用戶密碼的存儲。而sha1則經常用作數字簽名。
示例代碼:
#-*- encoding:utf-8-*-
import hashlib
a = "a test string"
print hashlib.md5(a).hexdigest()
四、range和xrange的區別
這兩個基本上都是在循環的時候用。
for i in range(0, 100):
print i
for i in xrange(0, 100):
print i
這兩個輸出的結果都是一樣的,實際上有很多不同,range會直接生成一個list對象:
a = range(0,100)
print type(a)
<type 'list'>
而xrange則不會直接生成一個list,而是每次調用返回其中的一個值
a = xrange(0,100)
print type(a)
<type 'xrange'>
所以xrange做循環的性能比range好,尤其是返回很大的時候, 儘量用xrange,除非你是要返回一個列表。
五、類、模塊、包
Python在處理功能複用和功能顆粒度劃分時採用了類、模塊、包的結構。這種處理跟C++中的類和名字空間類似,但更接近於Java所採用的概念。
類
類的概念在許多語言中出現,很容易理解。它將數據和操作進行封裝,以便將來的複用。
模塊
模塊,在Python可理解爲對應於一個文件。在創建了一個腳本文件後,定義了某些函數和變量。你在其他需要這些功能的文件中,導入這模塊,就可重用這些函數和變量。一般用module_name.fun_name,和module_name.var_name進行使用。這樣的語義用法使模塊看起來很像類或者名字空間,可將module_name 理解爲名字限定符。模塊名就是文件名去掉.py後綴。下面演示了一個簡單的例子:
1 2 3 4 5 6 7 8 9 10 11 12 | #moduel1.py def say(word): print word #caller.py import module1 print __name__ print module1.__name__ module1.say( 'hello' ) $ python caller.py __main__ module1 hello |
例子中演示了從文件中調用模塊的方法。這裏還展示了一個有趣的模塊屬性__name__,它的值由Python解釋器設定。如果腳本文件是作爲主程序調用,其值就設爲__main__,如果是作爲模塊被其他文件導入,它的值就是其文件名。這個屬性非常有用,常可用來進行模塊內置測試使用,你會經常在一些地方看到類似於下面的寫法,這些語句只在作爲主程序調用時才被執行。
if __name__ == '__main__':
app = wxapp(0)
app.MainLoop()
模塊搜索路徑
上面的例子中,當module1被導入後,python解釋器就在當前目錄下尋找module1.py的文件,然後再從環境變量PYTHONPATH尋找,如果這環境變量沒有設定,也不要緊,解釋器還會在安裝預先設定的的一些目錄尋找。這就是在導入下面這些標準模塊,一切美好事情能發生的原因。
import os
import sys
import threading
...
這些搜索目錄可在運行時動態改變,比如將module1.py不放在當前目錄,而放在一個冷僻的角落裏。這裏你就需要通過某種途徑,如sys.path,來告知Python了。sys.path返回的是模塊搜索列表,通過前後的輸出對比和代碼,應能理悟到如何增加新路徑的方法了吧。非常簡單,就是使用list的append()或insert()增加新的目錄。
1 2 3 4 5 6 7 8 9 10 | #module2.py import sys import os print sys.path workpath = os.path.dirname(os.path.abspath(sys.argv[ 0 ])) sys.path.insert( 0 , os.path.join(workpath, 'modules' )) print sys.path $ python module2.py [ 'e:\\Project\\Python' , 'C:\\WINDOWS\\system32\\python25.zip' , ...] [ 'e:\\Project\\Python\\modules' , 'e:\\Project\\Python' , 'C:\\WINDOWS\\system32\\python25.zip' , ...] |
其他的要點
模塊能像包含函數定義一樣,可包含一些可執行語句。這些可執行語句通常用來進行模塊的初始化工作。這些語句只在模塊第一次被導入時被執行。這非常重要,有些人以爲這些語句會多次導入多次執行,其實不然。
模塊在被導入執行時,python解釋器爲加快程序的啓動速度,會在與模塊文件同一目錄下生成.pyc文件。我們知道python是解釋性的腳本語言,而.pyc是經過編譯後的字節碼,這一工作會自動完成,而無需程序員手動執行。
包
在創建許許多多模塊後,我們可能希望將某些功能相近的文件組織在同一文件夾下,這裏就需要運用包的概念了。包對應於文件夾,使用包的方式跟模塊也類似,唯一需要注意的是,當文件夾當作包使用時,文件夾需要包含__init__.py文件,主要是爲了避免將文件夾名當作普通的字符串。__init__.py的內容可以爲空,一般用來進行包的某些初始化工作或者設置__all__值,__all__是在from package-name import *這語句使用的,全部導出定義過的模塊。
六、查看保留關鍵字
1.使用 import 導入keyword 模塊;
2.使用 keyword.kwlist 獲得所有的關鍵字
3.另外還可以使用 keyword.iskeyword (word) 的方式查看 word 是否爲關鍵字。