python初學遇到的問題總結

一、python中文編碼問題


其實python對中文的支持很好。不過需要注意下面這兩個問題:

        一個是python源文件的編碼,再有一個是python中的字符串string類型的編碼。這兩種類型的編碼默認都是ASCII,所以如果你的源文件中有中文就會報錯。


要將源文件的編碼修改可以這樣:

在文件的第一或第二行,寫上下面的任意一行

#coding=utf8

#-*- coding=utf8 -*-


這樣源文件就可以保存中文了。但是使用string的相應函數處理中文時,也會遇到編碼的錯誤,因爲string類型默認也是ASCII,因此需要使用下面的語句來改變string的編碼。

import sys

reload(sys)

sys.setdefaultencoding(‘utf8′)


二、查看字符串有哪些函數

    help(str)


三、python使用hash函數

hashlib是個專門提供hash算法的庫,現在裏面包括md5, sha1, sha224, sha256, sha384, sha512,使用非常簡單、方便。 md5經常用來做用戶密碼的存儲。而sha1則經常用作數字簽名。

示例代碼:

#-*- encoding:utf-8-*-

import hashlib


a = "a test string"

print hashlib.md5(a).hexdigest()


四、range和xrange的區別

這兩個基本上都是在循環的時候用。 
    for i in range(0, 100): 
    print i 

    for i in xrange(0, 100): 
    print i 
這兩個輸出的結果都是一樣的,實際上有很多不同,range會直接生成一個list對象: 
    a = range(0,100) 
    print type(a)

    <type 'list'>

而xrange則不會直接生成一個list,而是每次調用返回其中的一個值 
    a = xrange(0,100) 
    print type(a)

    <type 'xrange'>

所以xrange做循環的性能比range好,尤其是返回很大的時候, 儘量用xrange,除非你是要返回一個列表。



五、類、模塊、包

Python在處理功能複用和功能顆粒度劃分時採用了類、模塊、包的結構。這種處理跟C++中的類和名字空間類似,但更接近於Java所採用的概念。


類的概念在許多語言中出現,很容易理解。它將數據和操作進行封裝,以便將來的複用。


模塊

模塊,在Python可理解爲對應於一個文件。在創建了一個腳本文件後,定義了某些函數和變量。你在其他需要這些功能的文件中,導入這模塊,就可重用這些函數和變量。一般用module_name.fun_name,和module_name.var_name進行使用。這樣的語義用法使模塊看起來很像類或者名字空間,可將module_name 理解爲名字限定符。模塊名就是文件名去掉.py後綴。下面演示了一個簡單的例子:

1
2
3
4
5
6
7
8
9
10
11
12
#moduel1.py
def say(word):
    print word
#caller.py
import module1
print __name__
print module1.__name__
module1.say('hello')
$ python caller.py
__main__
module1
hello


例子中演示了從文件中調用模塊的方法。這裏還展示了一個有趣的模塊屬性__name__,它的值由Python解釋器設定。如果腳本文件是作爲主程序調用,其值就設爲__main__,如果是作爲模塊被其他文件導入,它的值就是其文件名。這個屬性非常有用,常可用來進行模塊內置測試使用,你會經常在一些地方看到類似於下面的寫法,這些語句只在作爲主程序調用時才被執行。

if __name__ == '__main__': 

 app = wxapp(0)

 app.MainLoop()


模塊搜索路徑

上面的例子中,當module1被導入後,python解釋器就在當前目錄下尋找module1.py的文件,然後再從環境變量PYTHONPATH尋找,如果這環境變量沒有設定,也不要緊,解釋器還會在安裝預先設定的的一些目錄尋找。這就是在導入下面這些標準模塊,一切美好事情能發生的原因。

import os

 import sys

 import threading
...

這些搜索目錄可在運行時動態改變,比如將module1.py不放在當前目錄,而放在一個冷僻的角落裏。這裏你就需要通過某種途徑,如sys.path,來告知Python了。sys.path返回的是模塊搜索列表,通過前後的輸出對比和代碼,應能理悟到如何增加新路徑的方法了吧。非常簡單,就是使用list的append()或insert()增加新的目錄。

1
2
3
4
5
6
7
8
9
10
#module2.py
import sys
import os
print sys.path
workpath = os.path.dirname(os.path.abspath(sys.argv[0]))
sys.path.insert(0, os.path.join(workpath, 'modules'))
print sys.path
$ python module2.py
['e:\\Project\\Python''C:\\WINDOWS\\system32\\python25.zip', ...]
['e:\\Project\\Python\\modules''e:\\Project\\Python','C:\\WINDOWS\\system32\\python25.zip', ...]


其他的要點

模塊能像包含函數定義一樣,可包含一些可執行語句。這些可執行語句通常用來進行模塊的初始化工作。這些語句只在模塊第一次被導入時被執行。這非常重要,有些人以爲這些語句會多次導入多次執行,其實不然。

模塊在被導入執行時,python解釋器爲加快程序的啓動速度,會在與模塊文件同一目錄下生成.pyc文件。我們知道python是解釋性的腳本語言,而.pyc是經過編譯後的字節碼,這一工作會自動完成,而無需程序員手動執行。


在創建許許多多模塊後,我們可能希望將某些功能相近的文件組織在同一文件夾下,這裏就需要運用包的概念了。包對應於文件夾,使用包的方式跟模塊也類似,唯一需要注意的是,當文件夾當作包使用時,文件夾需要包含__init__.py文件,主要是爲了避免將文件夾名當作普通的字符串。__init__.py的內容可以爲空,一般用來進行包的某些初始化工作或者設置__all__值,__all__是在from package-name import *這語句使用的,全部導出定義過的模塊。


六、查看保留關鍵字

1.使用 import 導入keyword 模塊; 

2.使用 keyword.kwlist 獲得所有的關鍵字 
3.另外還可以使用 keyword.iskeyword (word) 的方式查看 word 是否爲關鍵字。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章