python-10.菜鳥教程-2

Python3 迭代器與生成器

迭代器

迭代是Python最強大的功能之一,是訪問集合元素的一種方式。

迭代器是一個可以記住遍歷的位置的對象。

迭代器對象從集合的第一個元素開始訪問,直到所有的元素被訪問完結束。迭代器只能往前不會後退。

迭代器有兩個基本的方法:iter()next()

字符串,列表或元組對象都可用於創建迭代器:

>>> list=[1,2,3,4]
>>> it = iter(list)    # 創建迭代器對象
>>> print (next(it))   # 輸出迭代器的下一個元素
1
>>> print (next(it))
2
>>> 

迭代器對象可以使用常規for語句進行遍歷:

list1 = [1, 2, 3, 4]
it = iter(list1)  # 創建迭代器對象
for x in it:
    print(x, end=" ")

執行以上程序,輸出結果如下: 

1 2 3 4 

也可以使用 next() 函數:

import sys  # 引入 sys 模塊
list = [1, 2, 3, 4]
it = iter(list)  # 創建迭代器對象
while True:
    try:
        print(next(it))
    except StopIteration:
        sys.exit()

 執行以上程序,輸出結果如下:

1
2
3
4

創建一個迭代器

把一個類作爲一個迭代器使用需要在類中實現兩個方法 __iter__() 與 __next__() 。

如果你已經瞭解的面向對象編程,就知道類都有一個構造函數,Python 的構造函數爲 __init__(), 它會在對象初始化的時候執行。

更多內容查閱:Python3 面向對象

__iter__() 方法返回一個特殊的迭代器對象, 這個迭代器對象實現了 __next__() 方法並通過 StopIteration 異常標識迭代的完成。

__next__() 方法(Python 2 裏是 next())會返回下一個迭代器對象。

創建一個返回數字的迭代器,初始值爲 1,逐步遞增 1:

class MyNumbers:
    def __iter__(self):
        self.a = 1
        return self

    def __next__(self):
        x = self.a
        self.a += 1
        return x


myclass = MyNumbers()
myiter = iter(myclass)

print(next(myiter))
print(next(myiter))
print(next(myiter))
print(next(myiter))
print(next(myiter))

執行輸出結果爲: 

1
2
3
4
5

 

StopIteration

StopIteration 異常用於標識迭代的完成,防止出現無限循環的情況,在 __next__() 方法中我們可以設置在完成指定循環次數後觸發 StopIteration 異常來結束迭代。

在 20 次迭代後停止執行:

class MyNumbers:
    def __iter__(self):
        self.a = 1
        return self

    def __next__(self):
        if self.a <= 20:
            x = self.a
            self.a += 1
            return x
        else:
            raise StopIteration


myclass = MyNumbers()
myiter = iter(myclass)

for x in myiter:
    print(x)

執行輸出結果爲:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

生成器

在 Python 中,使用了 yield 的函數被稱爲生成器(generator)。

跟普通函數不同的是,生成器是一個返回迭代器的函數,只能用於迭代操作,更簡單點理解生成器就是一個迭代器。

在調用生成器運行的過程中,每次遇到 yield 時函數會暫停並保存當前所有的運行信息,返回 yield 的值, 並在下一次執行 next() 方法時從當前位置繼續運行。

調用一個生成器函數,返回的是一個迭代器對象。

以下實例使用 yield 實現斐波那契數列:

import sys


def fibonacci(n):  # 生成器函數 - 斐波那契
    a, b, counter = 0, 1, 0
    while True:
        if counter > n:
            return
        yield a
        a, b = b, a + b
        counter += 1


f = fibonacci(10)  # f 是一個迭代器,由生成器返回生成

while True:
    try:
        print(next(f), end=" ")
    except StopIteration:
        sys.exit()

執行以上程序,輸出結果如下:

0 1 1 2 3 5 8 13 21 34 55 

Python3 函數

函數是組織好的,可重複使用的,用來實現單一,或相關聯功能的代碼段。

函數能提高應用的模塊性,和代碼的重複利用率。你已經知道Python提供了許多內建函數,比如print()。但你也可以自己創建函數,這被叫做用戶自定義函數。


定義一個函數

你可以定義一個由自己想要功能的函數,以下是簡單的規則:

  • 函數代碼塊以 def 關鍵詞開頭,後接函數標識符名稱和圓括號 ()
  • 任何傳入參數和自變量必須放在圓括號中間,圓括號之間可以用於定義參數。
  • 函數的第一行語句可以選擇性地使用文檔字符串—用於存放函數說明。
  • 函數內容以冒號起始,並且縮進。
  • return [表達式] 結束函數,選擇性地返回一個值給調用方。不帶表達式的return相當於返回 None。

語法

Python 定義函數使用 def 關鍵字,一般格式如下:

def 函數名(參數列表):
    函數體

默認情況下,參數值和參數名稱是按函數聲明中定義的順序匹配起來的。

實例

讓我們使用函數來輸出"Hello World!":


>>>def hello() :
   print("Hello World!")
>>> hello()
Hello World!
>>>

更復雜點的應用,函數中帶上參數變量:

# 計算面積函數
def area(width, height):
    return width * height


def print_welcome(name):
    print("Welcome", name)


print_welcome("Runoob")
w = 4
h = 5
print("width =", w, " height =", h, " area =", area(w, h))

以上實例輸出結果:

Welcome Runoob
width = 4  height = 5  area = 20

函數調用

定義一個函數:給了函數一個名稱,指定了函數裏包含的參數,和代碼塊結構。

這個函數的基本結構完成以後,你可以通過另一個函數調用執行,也可以直接從 Python 命令提示符執行。

如下實例調用了 printme() 函數:

# 定義函數
def printme(str):
    # 打印任何傳入的字符串
    print(str)
    return


# 調用函數
printme("我要調用用戶自定義函數!")
printme("再次調用同一函數")

以上實例輸出結果: 

我要調用用戶自定義函數!
再次調用同一函數

參數傳遞

在 python 中,類型屬於對象,變量是沒有類型的:

a=[1,2,3]

a="Runoob"

以上代碼中,[1,2,3] 是 List 類型,"Runoob" 是 String 類型,而變量 a 是沒有類型,她僅僅是一個對象的引用(一個指針),可以是指向 List 類型對象,也可以是指向 String 類型對象。

可更改(mutable)與不可更改(immutable)對象

在 python 中,strings, tuples, 和 numbers 是不可更改的對象,而 list,dict 等則是可以修改的對象。

  • 不可變類型:變量賦值 a=5 後再賦值 a=10,這裏實際是新生成一個 int 值對象 10,再讓 a 指向它,而 5 被丟棄,不是改變a的值,相當於新生成了a。

  • 可變類型:變量賦值 la=[1,2,3,4] 後再賦值 la[2]=5 則是將 list la 的第三個元素值更改,本身la沒有動,只是其內部的一部分值被修改了。

python 函數的參數傳遞:

  • 不可變類型:類似 c++ 的值傳遞,如 整數、字符串、元組。如fun(a),傳遞的只是a的值,沒有影響a對象本身。比如在 fun(a)內部修改 a 的值,只是修改另一個複製的對象,不會影響 a 本身。

  • 可變類型:類似 c++ 的引用傳遞,如 列表,字典。如 fun(la),則是將 la 真正的傳過去,修改後fun外部的la也會受影響

python 中一切都是對象,嚴格意義我們不能說值傳遞還是引用傳遞,我們應該說傳不可變對象和傳可變對象。

python 傳不可變對象實例

def ChangeInt(a):
    a = 10


b = 2
ChangeInt(b)
print(b)  # 結果是 2
2

 

實例中有 int 對象 2,指向它的變量是 b,在傳遞給 ChangeInt 函數時,按傳值的方式複製了變量 b,a 和 b 都指向了同一個 Int 對象,在 a=10 時,則新生成一個 int 值對象 10,並讓 a 指向它。

傳可變對象實例

可變對象在函數裏修改了參數,那麼在調用這個函數的函數裏,原始的參數也被改變了。例如:

# 可寫函數說明
def changeme(mylist):
    """修改傳入的列表"""
    mylist.append([1, 2, 3, 4])
    print("函數內取值: ", mylist)
    return


# 調用changeme函數
mylist = [10, 20, 30]
changeme(mylist)
print("函數外取值: ", mylist)

傳入函數的和在末尾添加新內容的對象用的是同一個引用。故輸出結果如下:

函數內取值:  [10, 20, 30, [1, 2, 3, 4]]
函數外取值:  [10, 20, 30, [1, 2, 3, 4]]

參數

以下是調用函數時可使用的正式參數類型:

  • 必需參數
  • 關鍵字參數
  • 默認參數
  • 不定長參數

必需參數

必需參數須以正確的順序傳入函數。調用時的數量必須和聲明時的一樣。

調用 printme() 函數,你必須傳入一個參數,不然會出現語法錯誤:

# 可寫函數說明
def printme(str):
    """打印任何傳入的字符串"""
    print(str)
    return


# 調用 printme 函數,不加參數會報錯
printme()

以上實例輸出結果:

Traceback (most recent call last):
  File "test.py", line 10, in <module>
    printme()
TypeError: printme() missing 1 required positional argument: 'str'

關鍵字參數

關鍵字參數和函數調用關係緊密,函數調用使用關鍵字參數來確定傳入的參數值。

使用關鍵字參數允許函數調用時參數的順序與聲明時不一致,因爲 Python 解釋器能夠用參數名匹配參數值。

以下實例在函數 printme() 調用時使用參數名:

# 可寫函數說明
def printme(str):
    """打印任何傳入的字符串"""
    print(str)
    return


# 調用printme函數
printme(str="菜鳥教程")

以上實例輸出結果:

菜鳥教程

以下實例中演示了函數參數的使用不需要使用指定順序:

# 可寫函數說明
def printinfo(name, age):
    """打印任何傳入的字符串"""
    print("名字: ", name)
    print("年齡: ", age)
    return


# 調用printinfo函數
printinfo(age=50, name="runoob")

以上實例輸出結果:

名字:  runoob
年齡:  50

默認參數

調用函數時,如果沒有傳遞參數,則會使用默認參數。以下實例中如果沒有傳入 age 參數,則使用默認值:

# 可寫函數說明
def printinfo(name, age=35):
    """打印任何傳入的字符串"""
    print("名字: ", name)
    print("年齡: ", age)
    return


# 調用printinfo函數
printinfo(age=50, name="runoob")
print("------------------------")
printinfo(name="runoob")

以上實例輸出結果:

名字:  runoob
年齡:  50
------------------------
名字:  runoob
年齡:  35

不定長參數

你可能需要一個函數能處理比當初聲明時更多的參數。這些參數叫做不定長參數,和上述 2 種參數不同,聲明時不會命名。基本語法如下:

def functionname([formal_args,] *var_args_tuple ):
   """函數_文檔字符串"""
   function_suite
   return [expression]

加了星號 * 的參數會以元組(tuple)的形式導入,存放所有未命名的變量參數。

# 可寫函數說明
def printinfo(arg1, *vartuple):
    """打印任何傳入的參數"""
    print("輸出: ")
    print(arg1)
    print(vartuple)


# 調用printinfo 函數
printinfo(70, 60, 50)

以上實例輸出結果:

輸出: 
70
(60, 50)

如果在函數調用時沒有指定參數,它就是一個空元組。我們也可以不向函數傳遞未命名的變量。如下實例:

# 可寫函數說明
def printinfo(arg1, *vartuple):
    """打印任何傳入的參數"""
    print("輸出: ")
    print(arg1)
    for var in vartuple:
        print(var)
    return


# 調用printinfo 函數
printinfo(10)
printinfo(70, 60, 50)

以上實例輸出結果:

輸出: 
10
輸出: 
70
60
50

還有一種就是參數帶兩個星號 **基本語法如下:

def functionname([formal_args,] **var_args_dict ):
   """函數_文檔字符串"""
   function_suite
   return [expression]

加了兩個星號 ** 的參數會以字典的形式導入。

# 可寫函數說明
def printinfo(arg1, **vardict):
    """打印任何傳入的參數"""
    print("輸出: ")
    print(arg1)
    print(vardict)


# 調用printinfo 函數
printinfo(1, a=2, b=3)

 以上實例輸出結果:

輸出: 
1
{'a': 2, 'b': 3}

聲明函數時,參數中星號 * 可以單獨出現,例如:

def f(a,b,*,c):
    return a+b+c

如果單獨出現星號 * 後的參數必須用關鍵字傳入。

def f(a, b, *, c):
    return a + b + c


print(f(1, 2, c=3))  # 正常
print(f(1, 2, 3))  # 報錯

匿名函數

python 使用 lambda 來創建匿名函數。

所謂匿名,意即不再使用 def 語句這樣標準的形式定義一個函數。

  • lambda 只是一個表達式,函數體比 def 簡單很多。
  • lambda的主體是一個表達式,而不是一個代碼塊。僅僅能在lambda表達式中封裝有限的邏輯進去。
  • lambda 函數擁有自己的命名空間,且不能訪問自己參數列表之外或全局命名空間裏的參數。
  • 雖然lambda函數看起來只能寫一行,卻不等同於C或C++的內聯函數,後者的目的是調用小函數時不佔用棧內存從而增加運行效率。

語法

lambda 函數的語法只包含一個語句,如下:

lambda [arg1 [,arg2,.....argn]]:expression

如下實例:

# 可寫函數說明
sum = lambda arg1, arg2: arg1 + arg2

# 調用sum函數
print("相加後的值爲 : ", sum(10, 20))
print("相加後的值爲 : ", sum(20, 20))

以上實例輸出結果:

相加後的值爲 :  30
相加後的值爲 :  40

return語句

return [表達式] 語句用於退出函數,選擇性地向調用方返回一個表達式。不帶參數值的return語句返回None。之前的例子都沒有示範如何返回數值,以下實例演示了 return 語句的用法:

# 可寫函數說明
def sum(arg1, arg2):
    """返回2個參數的和."""
    total = arg1 + arg2
    print("函數內 : ", total)
    return total


# 調用sum函數
total = sum(10, 20)
print("函數外 : ", total)

以上實例輸出結果 

函數內 :  30
函數外 :  30

強制位置參數

Python3.8 新增了一個函數形參語法 / 用來指明函數形參必須使用指定位置參數,不能使用關鍵字參數的形式。

在以下的例子中,形參 a 和 b 必須使用指定位置參數,c 或 d 可以是位置形參或關鍵字形參,而 e 或 f 要求爲關鍵字形參:

def f(a, b, /, c, d, *, e, f):
    print(a, b, c, d, e, f)

以下使用方法是正確的:

f(10, 20, 30, d=40, e=50, f=60)

以下使用方法會發生錯誤:

f(10, b=20, c=30, d=40, e=50, f=60)   # b 不能使用關鍵字參數的形式
f(10, 20, 30, 40, 50, f=60)           # e 必須使用關鍵字參數的形式

Python3 數據結構

本章節我們主要結合前面所學的知識點來介紹Python數據結構。


列表

Python中列表是可變的,這是它區別於字符串和元組的最重要的特點,一句話概括即:列表可以修改,而字符串和元組不能。

以下是 Python 中列表的方法:

方法 描述
list.append(x) 把一個元素添加到列表的結尾,相當於 a[len(a):] = [x]。
list.extend(L) 通過添加指定列表的所有元素來擴充列表,相當於 a[len(a):] = L。
list.insert(i, x) 在指定位置插入一個元素。第一個參數是準備插入到其前面的那個元素的索引,例如 a.insert(0, x) 會插入到整個列表之前,而 a.insert(len(a), x) 相當於 a.append(x) 。
list.remove(x) 刪除列表中值爲 x 的第一個元素。如果沒有這樣的元素,就會返回一個錯誤。
list.pop([i]) 從列表的指定位置移除元素,並將其返回。如果沒有指定索引,a.pop()返回最後一個元素。元素隨即從列表中被移除。(方法中 i 兩邊的方括號表示這個參數是可選的,而不是要求你輸入一對方括號,你會經常在 Python 庫參考手冊中遇到這樣的標記。)
list.clear() 移除列表中的所有項,等於del a[:]。
list.index(x) 返回列表中第一個值爲 x 的元素的索引。如果沒有匹配的元素就會返回一個錯誤。
list.count(x) 返回 x 在列表中出現的次數。
list.sort() 對列表中的元素進行排序。
list.reverse() 倒排列表中的元素。
list.copy() 返回列表的淺複製,等於a[:]。

下面示例演示了列表的大部分方法:

a = [66.25, 333, 333, 1, 1234.5]
print(a.count(333), a.count(66.25), a.count('x'))
a.insert(2, -1)
a.append(333)
print(a)
print(a.index(66.25))
a.reverse()
# print(a.reverse())  # 輸出結果是None
print(a)
a.sort()
print(a)
# print(a.sort())  # 輸出結果是None
2 1 0
[66.25, 333, -1, 333, 1, 1234.5, 333]
0
[333, 1234.5, 1, 333, -1, 333, 66.25]
[-1, 1, 66.25, 333, 333, 333, 1234.5]

注意:類似 insert, remove 或 sort 等修改列表的方法沒有返回值。

將列表當做堆棧使用

列表方法使得列表可以很方便的作爲一個堆棧來使用,堆棧作爲特定的數據結構,最先進入的元素最後一個被釋放(後進先出)。用 append() 方法可以把一個元素添加到堆棧頂。用不指定索引的 pop() 方法可以把一個元素從堆棧頂釋放出來。例如:

'''
將列表當做堆棧使用
列表方法使得列表可以很方便的作爲一個堆棧來使用,堆棧作爲特定的數據結構,
最先進入的元素最後一個被釋放(後進先出)。
用 append() 方法可以把一個元素添加到堆棧頂。
用不指定索引的 pop() 方法可以把一個元素從堆棧頂釋放出來。
例如: 
'''
stack = [3, 4, 5]
stack.append(6)
stack.append(7)
print(stack)
stack.pop()  # 從堆棧頂釋放出來
print(stack)
stack.pop()
print(stack)
stack.pop()
print(stack)
[3, 4, 5, 6, 7]
[3, 4, 5, 6]
[3, 4, 5]
[3, 4]

將列表當作隊列使用

也可以把列表當做隊列用,只是在隊列裏第一加入的元素,第一個取出來;但是拿列表用作這樣的目的效率不高。在列表的最後添加或者彈出元素速度快,然而在列表裏插入或者從頭部彈出速度卻不快(因爲所有其他的元素都得一個一個地移動)。

from collections import deque

queue = deque(["Eric", "John", "Michael"])
queue.append("Terry")  # Terry arrives
queue.append("Graham")  # Graham arrives
print(queue)
queue.popleft()  # The first to arrive now leaves
print(queue)
queue.popleft()  # The second to arrive now leaves
print(queue)     # Remaining queue in order of arrival
deque(['Eric', 'John', 'Michael', 'Terry', 'Graham'])
deque(['John', 'Michael', 'Terry', 'Graham'])
deque(['Michael', 'Terry', 'Graham'])

列表推導式

列表推導式提供了從序列創建列表的簡單途徑。通常應用程序將一些操作應用於某個序列的每個元素,用其獲得的結果作爲生成新列表的元素,或者根據確定的判定條件創建子序列。

每個列表推導式都在 for 之後跟一個表達式,然後有零到多個 for 或 if 子句。返回結果是一個根據表達從其後的 for 和 if 上下文環境中生成出來的列表。如果希望表達式推導出一個元組,就必須使用括號。

這裏我們將列表中每個數值乘三,獲得一個新的列表:

vec = [2, 4, 6]
list1 = [3 * x for x in vec]
print(list1)
list2 = [[x, x ** 2] for x in vec]
print(list2)
[6, 12, 18]
[[2, 4], [4, 16], [6, 36]]

這裏我們對序列裏每一個元素逐個調用某方法:

freshFruit = ['  banana', '  loganberry ', 'passion fruit  ']
array = [weapon.strip() for weapon in freshFruit]
print(array)

我們可以用 if 子句作爲過濾器:

vec = [2, 4, 6]
list3 = [3 * x for x in vec if x > 3]
print(list3)
list4 = [3 * x for x in vec if x < 2]
print(list4)
[12, 18]
[]

以下是一些關於循環和其它技巧的演示:

vec1 = [2, 4, 6]
vec2 = [4, 3, -9]

list5 = [x * y for x in vec1 for y in vec2]
list6 = [x + y for x in vec1 for y in vec2]
list7 = [vec1[i] * vec2[i] for i in range(len(vec1))]
print(len(vec1))
print(list5)
print(list6)
print(list7)
3
[8, 6, -18, 16, 12, -36, 24, 18, -54]
[6, 5, -7, 8, 7, -5, 10, 9, -3]
[8, 12, -54]

列表推導式可以使用複雜表達式或嵌套函數:

print([str(round(355 / 113, i)) for i in range(1, 6)])
['3.1', '3.14', '3.142', '3.1416', '3.14159']

 

嵌套列表解析

Python的列表還可以嵌套。

以下實例展示了3X4的矩陣列表:

matrix = [
    [1, 2, 3, 4],
    [5, 6, 7, 8],
    [9, 10, 11, 12],
]

print([[row[i] for row in matrix] for i in range(4)])
[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]

以上實例也可以使用以下方法來實現:

>>> transposed = []
>>> for i in range(4):
...     transposed.append([row[i] for row in matrix])
...
>>> transposed
[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]
matrix = [
    [1, 2, 3, 4],
    [5, 6, 7, 8],
    [9, 10, 11, 12],
]

print([[row[i] for row in matrix] for i in range(4)])

transposed = []
for i in range(4):
    transposed.append([row[i] for row in matrix])

print(transposed)
[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]
[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]

另外一種實現方法:

transposed = []
for i in range(4):
    """the following 3 lines implement the nested listcomp"""
    transposed_row = []
    for row in matrix:
        transposed_row.append(row[i])
    transposed.append(transposed_row)

print(transposed)
[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]

del 語句

使用 del 語句可以從一個列表中依索引而不是值來刪除一個元素。這與使用 pop() 返回一個值不同。可以用 del 語句從列表中刪除一個切割,或清空整個列表(我們以前介紹的方法是給該切割賦一個空列表)。例如:


a = [-1, 1, 66.25, 333, 333, 1234.5]
del a[0]
print(a)
del a[2:4]
print(a)
del a[:]
print(a)
[1, 66.25, 333, 333, 1234.5]
[1, 66.25, 1234.5]
[]

也可以用 del 刪除實體變量:

del a

元組和序列

元組由若干逗號分隔的值組成,例如:

t = 12345, 54321, 'hello!'
print(t[0])
print(t)
# Tuples may be nested:
u = t, (1, 2, 3, 4, 5)
print(u)

12345
(12345, 54321, 'hello!')
((12345, 54321, 'hello!'), (1, 2, 3, 4, 5))

如你所見,元組在輸出時總是有括號的,以便於正確表達嵌套結構。在輸入時可能有或沒有括號, 不過括號通常是必須的(如果元組是更大的表達式的一部分)。

集合

集合是一個無序不重複元素的集。基本功能包括關係測試和消除重複元素。

可以用大括號({})創建集合。注意:如果要創建一個空集合,你必須用 set() 而不是 {} ;後者創建一個空的字典,下一節我們會介紹這個數據結構。

以下是一個簡單的演示:

>>> basket = {'apple', 'orange', 'apple', 'pear', 'orange', 'banana'}
>>> print(basket)                      # 刪除重複的
{'orange', 'banana', 'pear', 'apple'}
>>> 'orange' in basket                 # 檢測成員
True
>>> 'crabgrass' in basket
False

>>> # 以下演示了兩個集合的操作
...
>>> a = set('abracadabra')
>>> b = set('alacazam')
>>> a                                  # a 中唯一的字母
{'a', 'r', 'b', 'c', 'd'}
>>> a - b                              # 在 a 中的字母,但不在 b 中
{'r', 'd', 'b'}
>>> a | b                              # 在 a 或 b 中的字母
{'a', 'c', 'r', 'd', 'b', 'm', 'z', 'l'}
>>> a & b                              # 在 a 和 b 中都有的字母
{'a', 'c'}
>>> a ^ b                              # 在 a 或 b 中的字母,但不同時在 a 和 b 中
{'r', 'd', 'b', 'm', 'z', 'l'}

集合也支持推導式

>>> a = {x for x in 'abracadabra' if x not in 'abc'}
>>> a
{'r', 'd'}

字典

另一個非常有用的 Python 內建數據類型是字典。

序列是以連續的整數爲索引,與此不同的是,字典以關鍵字爲索引,關鍵字可以是任意不可變類型,通常用字符串或數值。

理解字典的最佳方式是把它看做無序的鍵=>值對集合。在同一個字典之內,關鍵字必須是互不相同。

一對大括號創建一個空的字典:{}。

這是一個字典運用的簡單例子:

>>> tel = {'jack': 4098, 'sape': 4139}
>>> tel['guido'] = 4127
>>> tel
{'sape': 4139, 'guido': 4127, 'jack': 4098}
>>> tel['jack']
4098
>>> del tel['sape']
>>> tel['irv'] = 4127
>>> tel
{'guido': 4127, 'irv': 4127, 'jack': 4098}
>>> list(tel.keys())
['irv', 'guido', 'jack']
>>> sorted(tel.keys())
['guido', 'irv', 'jack']
>>> 'guido' in tel
True
>>> 'jack' not in tel
False

構造函數 dict() 直接從鍵值對元組列表中構建字典。如果有固定的模式,列表推導式指定特定的鍵值對:

>>> dict([('sape', 4139), ('guido', 4127), ('jack', 4098)])
{'sape': 4139, 'jack': 4098, 'guido': 4127}

此外,字典推導可以用來創建任意鍵和值的表達式詞典:

>>> {x: x**2 for x in (2, 4, 6)}
{2: 4, 4: 16, 6: 36}

如果關鍵字只是簡單的字符串,使用關鍵字參數指定鍵值對有時候更方便:

>>> dict(sape=4139, guido=4127, jack=4098)
{'sape': 4139, 'jack': 4098, 'guido': 4127}

遍歷技巧

在字典中遍歷時,關鍵字和對應的值可以使用 items() 方法同時解讀出來:

>>> knights = {'gallahad': 'the pure', 'robin': 'the brave'}
>>> for k, v in knights.items():
...     print(k, v)
...
gallahad the pure
robin the brave

在序列中遍歷時,索引位置和對應值可以使用 enumerate() 函數同時得到:

>>> for i, v in enumerate(['tic', 'tac', 'toe']):
...     print(i, v)
...
0 tic
1 tac
2 toe

同時遍歷兩個或更多的序列,可以使用 zip() 組合

>>> questions = ['name', 'quest', 'favorite color']
>>> answers = ['lancelot', 'the holy grail', 'blue']
>>> for q, a in zip(questions, answers):
...     print('What is your {0}?  It is {1}.'.format(q, a))
...
What is your name?  It is lancelot.
What is your quest?  It is the holy grail.
What is your favorite color?  It is blue.
questions = ['name', 'quest', 'favorite color']
answers = ['lancelot', 'the holy grail', 'blue']
for q, a in zip(questions, answers):
    print('What is your {0}?  It is {1}.'.format(q, a))
What is your name?  It is lancelot.
What is your quest?  It is the holy grail.
What is your favorite color?  It is blue.

要反向遍歷一個序列,首先指定這個序列,然後調用 reversed() 函數:

for i in reversed(range(1, 10, 2)):
    print(i)
9
7
5
3
1

要按順序遍歷一個序列,使用 sorted() 函數返回一個已排序的序列,並不修改原值:

basket = ['apple', 'orange', 'apple', 'pear', 'orange', 'banana']
for f in sorted(set(basket)):
    print(f)
apple
banana
orange
pear

Python3 模塊

在前面的幾個章節中我們腳本上是用 python 解釋器來編程,如果你從 Python 解釋器退出再進入,那麼你定義的所有的方法和變量就都消失了。

爲此 Python 提供了一個辦法,把這些定義存放在文件中,爲一些腳本或者交互式的解釋器實例使用,這個文件被稱爲模塊。

模塊是一個包含所有你定義的函數和變量的文件,其後綴名是.py。模塊可以被別的程序引入,以使用該模塊中的函數等功能。這也是使用 python 標準庫的方法。

下面是一個使用 python 標準庫中模塊的例子。


#!/usr/bin/python3
# 文件名: using_sys.py
 
import sys
 
print('命令行參數如下:')
for i in sys.argv:
   print(i)
 
print('\n\nPython 路徑爲:', sys.path, '\n')

執行結果如下所示:

$ python using_sys.py 參數1 參數2
命令行參數如下:
using_sys.py
參數1
參數2


Python 路徑爲: ['/root', '/usr/lib/python3.4', '/usr/lib/python3.4/plat-x86_64-linux-gnu', '/usr/lib/python3.4/lib-dynload', '/usr/local/lib/python3.4/dist-packages', '/usr/lib/python3/dist-packages'] 
  • 1、import sys 引入 python 標準庫中的 sys.py 模塊;這是引入某一模塊的方法。
  • 2、sys.argv 是一個包含命令行參數的列表。
  • 3、sys.path 包含了一個 Python 解釋器自動查找所需模塊的路徑的列表。

 

import 語句

想使用 Python 源文件,只需在另一個源文件裏執行 import 語句,語法如下:

import module1[, module2[,... moduleN]

當解釋器遇到 import 語句,如果模塊在當前的搜索路徑就會被導入。

搜索路徑是一個解釋器會先進行搜索的所有目錄的列表。如想要導入模塊 support,需要把命令放在腳本的頂端:

support.py 文件代碼


#!/usr/bin/python3
# Filename: support.py
 
def print_func( par ):
    print ("Hello : ", par)
    return

test.py 引入 support 模塊:


#!/usr/bin/python3
# Filename: test.py
 
# 導入模塊
import support
 
# 現在可以調用模塊裏包含的函數了
support.print_func("Runoob")

以上實例輸出結果:

$ python3 test.py 
Hello :  Runoob

一個模塊只會被導入一次,不管你執行了多少次import。這樣可以防止導入模塊被一遍又一遍地執行。

當我們使用import語句的時候,Python解釋器是怎樣找到對應的文件的呢?

這就涉及到Python的搜索路徑,搜索路徑是由一系列目錄名組成的,Python解釋器就依次從這些目錄中去尋找所引入的模塊。

這看起來很像環境變量,事實上,也可以通過定義環境變量的方式來確定搜索路徑。

搜索路徑是在Python編譯或安裝的時候確定的,安裝新的庫應該也會修改。搜索路徑被存儲在sys模塊中的path變量,做一個簡單的實驗,在交互式解釋器中,輸入以下代碼:

>>> import sys
>>> sys.path
['', '/usr/lib/python3.4', '/usr/lib/python3.4/plat-x86_64-linux-gnu', '/usr/lib/python3.4/lib-dynload', '/usr/local/lib/python3.4/dist-packages', '/usr/lib/python3/dist-packages']
>>> 

sys.path 輸出是一個列表,其中第一項是空串'',代表當前目錄(若是從一個腳本中打印出來的話,可以更清楚地看出是哪個目錄),亦即我們執行python解釋器的目錄(對於腳本的話就是運行的腳本所在的目錄)。

因此若像我一樣在當前目錄下存在與要引入模塊同名的文件,就會把要引入的模塊屏蔽掉。

瞭解了搜索路徑的概念,就可以在腳本中修改sys.path來引入一些不在搜索路徑中的模塊。

現在,在解釋器的當前目錄或者 sys.path 中的一個目錄裏面來創建一個fibo.py的文件,代碼如下:

# 斐波那契(fibonacci)數列模塊

def fib(n):  # 定義到 n 的斐波那契數列
    a, b = 0, 1
    while b < n:
        print(b, end=' ')
        a, b = b, a + b
    print()


def fib2(n):  # 返回到 n 的斐波那契數列
    result = []
    a, b = 0, 1
    while b < n:
        result.append(b)
        a, b = b, a + b
    return result

然後進入Python解釋器,使用下面的命令導入這個模塊:

>>> import fibo

這樣做並沒有把直接定義在fibo中的函數名稱寫入到當前符號表裏,只是把模塊fibo的名字寫到了那裏。

可以使用模塊名稱來訪問函數:


>>>fibo.fib(1000)
1 1 2 3 5 8 13 21 34 55 89 144 233 377 610 987
>>> fibo.fib2(100)
[1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89]
>>> fibo.__name__
'fibo'

如果你打算經常使用一個函數,你可以把它賦給一個本地的名稱:

>>> fib = fibo.fib
>>> fib(500)
1 1 2 3 5 8 13 21 34 55 89 144 233 377

from … import 語句

Python 的 from 語句讓你從模塊中導入一個指定的部分到當前命名空間中,語法如下:

from modname import name1[, name2[, ... nameN]]

例如,要導入模塊 fibo 的 fib 函數,使用如下語句:

>>> from fibo import fib, fib2
>>> fib(500)
1 1 2 3 5 8 13 21 34 55 89 144 233 377

這個聲明不會把整個fibo模塊導入到當前的命名空間中,它只會將fibo裏的fib函數引入進來。

from … import * 語句

把一個模塊的所有內容全都導入到當前的命名空間也是可行的,只需使用如下聲明:

from modname import *

這提供了一個簡單的方法來導入一個模塊中的所有項目。然而這種聲明不該被過多地使用。

深入模塊

模塊除了方法定義,還可以包括可執行的代碼。這些代碼一般用來初始化這個模塊。這些代碼只有在第一次被導入時纔會被執行。

每個模塊有各自獨立的符號表,在模塊內部爲所有的函數當作全局符號表來使用。

所以,模塊的作者可以放心大膽的在模塊內部使用這些全局變量,而不用擔心把其他用戶的全局變量搞混。

從另一個方面,當你確實知道你在做什麼的話,你也可以通過 modname.itemname 這樣的表示法來訪問模塊內的函數。

模塊是可以導入其他模塊的。在一個模塊(或者腳本,或者其他地方)的最前面使用 import 來導入一個模塊,當然這只是一個慣例,而不是強制的。被導入的模塊的名稱將被放入當前操作的模塊的符號表中。

還有一種導入的方法,可以使用 import 直接把模塊內(函數,變量的)名稱導入到當前操作模塊。比如:

>>> from fibo import fib, fib2
>>> fib(500)
1 1 2 3 5 8 13 21 34 55 89 144 233 377

這種導入的方法不會把被導入的模塊的名稱放在當前的字符表中(所以在這個例子裏面,fibo 這個名稱是沒有定義的)。

這還有一種方法,可以一次性的把模塊中的所有(函數,變量)名稱都導入到當前模塊的字符表:

>>> from fibo import *
>>> fib(500)
1 1 2 3 5 8 13 21 34 55 89 144 233 377

這將把所有的名字都導入進來,但是那些由單一下劃線(_)開頭的名字不在此例。大多數情況, Python程序員不使用這種方法,因爲引入的其它來源的命名,很可能覆蓋了已有的定義。

__name__屬性

一個模塊被另一個程序第一次引入時,其主程序將運行。如果我們想在模塊被引入時,模塊中的某一程序塊不執行,我們可以用__name__屬性來使該程序塊僅在該模塊自身運行時執行。

#!/usr/bin/python3
# Filename: using_name.py

if __name__ == '__main__':
   print('程序自身在運行')
else:
   print('我來自另一模塊')

運行輸出如下:

$ python using_name.py
程序自身在運行
$ python
>>> import using_name
我來自另一模塊
>>>

說明: 每個模塊都有一個__name__屬性,當其值是'__main__'時,表明該模塊自身在運行,否則是被引入

說明:__name____main__ 底下是雙下劃線, _ _ 是這樣去掉中間的那個空格。

dir() 函數

內置的函數 dir() 可以找到模塊內定義的所有名稱。以一個字符串列表的形式返回:

>>> import fibo, sys
>>> dir(fibo)
['__name__', 'fib', 'fib2']
>>> dir(sys)  
['__displayhook__', '__doc__', '__excepthook__', '__loader__', '__name__',
 '__package__', '__stderr__', '__stdin__', '__stdout__',
 '_clear_type_cache', '_current_frames', '_debugmallocstats', '_getframe',
 '_home', '_mercurial', '_xoptions', 'abiflags', 'api_version', 'argv',
 'base_exec_prefix', 'base_prefix', 'builtin_module_names', 'byteorder',
 'call_tracing', 'callstats', 'copyright', 'displayhook',
 'dont_write_bytecode', 'exc_info', 'excepthook', 'exec_prefix',
 'executable', 'exit', 'flags', 'float_info', 'float_repr_style',
 'getcheckinterval', 'getdefaultencoding', 'getdlopenflags',
 'getfilesystemencoding', 'getobjects', 'getprofile', 'getrecursionlimit',
 'getrefcount', 'getsizeof', 'getswitchinterval', 'gettotalrefcount',
 'gettrace', 'hash_info', 'hexversion', 'implementation', 'int_info',
 'intern', 'maxsize', 'maxunicode', 'meta_path', 'modules', 'path',
 'path_hooks', 'path_importer_cache', 'platform', 'prefix', 'ps1',
 'setcheckinterval', 'setdlopenflags', 'setprofile', 'setrecursionlimit',
 'setswitchinterval', 'settrace', 'stderr', 'stdin', 'stdout',
 'thread_info', 'version', 'version_info', 'warnoptions']

如果沒有給定參數,那麼 dir() 函數會羅列出當前定義的所有名稱:

>>> a = [1, 2, 3, 4, 5]
>>> import fibo
>>> fib = fibo.fib
>>> dir() # 得到一個當前模塊中定義的屬性列表
['__builtins__', '__name__', 'a', 'fib', 'fibo', 'sys']
>>> a = 5 # 建立一個新的變量 'a'
>>> dir()
['__builtins__', '__doc__', '__name__', 'a', 'sys']
>>>
>>> del a # 刪除變量名a
>>>
>>> dir()
['__builtins__', '__doc__', '__name__', 'sys']
>>>

標準模塊

Python 本身帶着一些標準的模塊庫,在 Python 庫參考文檔中將會介紹到(就是後面的"庫參考文檔")。

有些模塊直接被構建在解析器裏,這些雖然不是一些語言內置的功能,但是他卻能很高效的使用,甚至是系統級調用也沒問題。

這些組件會根據不同的操作系統進行不同形式的配置,比如 winreg 這個模塊就只會提供給 Windows 系統。

應該注意到這有一個特別的模塊 sys ,它內置在每一個 Python 解析器中。變量 sys.ps1 和 sys.ps2 定義了主提示符和副提示符所對應的字符串:

>>> import sys
>>> sys.ps1
'>>> '
>>> sys.ps2
'... '
>>> sys.ps1 = 'C> '
C> print('Runoob!')
Runoob!
C> 

包是一種管理 Python 模塊命名空間的形式,採用"點模塊名稱"。

比如一個模塊的名稱是 A.B, 那麼他表示一個包 A中的子模塊 B

就好像使用模塊的時候,你不用擔心不同模塊之間的全局變量相互影響一樣,採用點模塊名稱這種形式也不用擔心不同庫之間的模塊重名的情況。

這樣不同的作者都可以提供 NumPy 模塊,或者是 Python 圖形庫。

不妨假設你想設計一套統一處理聲音文件和數據的模塊(或者稱之爲一個"包")。

現存很多種不同的音頻文件格式(基本上都是通過後綴名區分的,例如: .wav,:file:.aiff,:file:.au,),所以你需要有一組不斷增加的模塊,用來在不同的格式之間轉換。

並且針對這些音頻數據,還有很多不同的操作(比如混音,添加回聲,增加均衡器功能,創建人造立體聲效果),所以你還需要一組怎麼也寫不完的模塊來處理這些操作。

這裏給出了一種可能的包結構(在分層的文件系統中):

sound/                          頂層包
      __init__.py               初始化 sound 包
      formats/                  文件格式轉換子包
              __init__.py
              wavread.py
              wavwrite.py
              aiffread.py
              aiffwrite.py
              auread.py
              auwrite.py
              ...
      effects/                  聲音效果子包
              __init__.py
              echo.py
              surround.py
              reverse.py
              ...
      filters/                  filters 子包
              __init__.py
              equalizer.py
              vocoder.py
              karaoke.py
              ...

在導入一個包的時候,Python 會根據 sys.path 中的目錄來尋找這個包中包含的子目錄。

目錄只有包含一個叫做 __init__.py 的文件纔會被認作是一個包,主要是爲了避免一些濫俗的名字(比如叫做 string)不小心的影響搜索路徑中的有效模塊。

最簡單的情況,放一個空的 :file:__init__.py就可以了。當然這個文件中也可以包含一些初始化代碼或者爲(將在後面介紹的) __all__變量賦值。

用戶可以每次只導入一個包裏面的特定模塊,比如:

import sound.effects.echo

這將會導入子模塊:sound.effects.echo。 他必須使用全名去訪問:

sound.effects.echo.echofilter(input, output, delay=0.7, atten=4)

還有一種導入子模塊的方法是:

from sound.effects import echo

這同樣會導入子模塊: echo,並且他不需要那些冗長的前綴,所以他可以這樣使用:

echo.echofilter(input, output, delay=0.7, atten=4)

還有一種變化就是直接導入一個函數或者變量:

from sound.effects.echo import echofilter

同樣的,這種方法會導入子模塊: echo,並且可以直接使用他的 echofilter() 函數:

echofilter(input, output, delay=0.7, atten=4)

注意當使用 from package import item 這種形式的時候,對應的 item 既可以是包裏面的子模塊(子包),或者包裏面定義的其他名稱,比如函數,類或者變量。

import 語法會首先把 item 當作一個包定義的名稱,如果沒找到,再試圖按照一個模塊去導入。如果還沒找到,拋出一個 :exc:ImportError 異常。

反之,如果使用形如 import item.subitem.subsubitem 這種導入形式,除了最後一項,都必須是包,而最後一項則可以是模塊或者是包,但是不可以是類,函數或者變量的名字。

從一個包中導入*

設想一下,如果我們使用 from sound.effects import *會發生什麼?

Python 會進入文件系統,找到這個包裏面所有的子模塊,一個一個的把它們都導入進來。

但是很不幸,這個方法在 Windows平臺上工作的就不是非常好,因爲Windows是一個大小寫不區分的系統。

在這類平臺上,沒有人敢擔保一個叫做 ECHO.py 的文件導入爲模塊 echo 還是 Echo 甚至 ECHO。

(例如,Windows 95就很討厭的把每一個文件的首字母大寫顯示)而且 DOS 的 8+3 命名規則對長模塊名稱的處理會把問題搞得更糾結。

爲了解決這個問題,只能煩勞包作者提供一個精確的包的索引了。

導入語句遵循如下規則:如果包定義文件 __init__.py 存在一個叫做 __all__ 的列表變量,那麼在使用 from package import * 的時候就把這個列表中的所有名字作爲包內容導入。

 

作爲包的作者,可別忘了在更新包之後保證 __all__ 也更新了啊。你說我就不這麼做,我就不使用導入*這種用法,好吧,沒問題,誰讓你是老闆呢。這裏有一個例子,在:file:sounds/effects/__init__.py中包含如下代碼:

__all__ = ["echo", "surround", "reverse"]

這表示當你使用from sound.effects import *這種用法時,你只會導入包裏面這三個子模塊。

如果 __all__ 真的沒有定義,那麼使用from sound.effects import *這種語法的時候,就不會導入包 sound.effects 裏的任何子模塊。他只是把包sound.effects和它裏面定義的所有內容導入進來(可能運行__init__.py裏定義的初始化代碼)。

這會把 __init__.py 裏面定義的所有名字導入進來。並且他不會破壞掉我們在這句話之前導入的所有明確指定的模塊。看下這部分代碼:

import sound.effects.echo
import sound.effects.surround
from sound.effects import *

這個例子中,在執行 from...import 前,包 sound.effects 中的 echo 和 surround 模塊都被導入到當前的命名空間中了。(當然如果定義了 __all__ 就更沒問題了)

通常我們並不主張使用 * 這種方法來導入模塊,因爲這種方法經常會導致代碼的可讀性降低。不過這樣倒的確是可以省去不少敲鍵的功夫,而且一些模塊都設計成了只能通過特定的方法導入。

記住,使用 from Package import specific_submodule 這種方法永遠不會有錯。事實上,這也是推薦的方法。除非是你要導入的子模塊有可能和其他包的子模塊重名。

如果在結構中包是一個子包(比如這個例子中對於包sound來說),而你又想導入兄弟包(同級別的包)你就得使用導入絕對的路徑來導入。比如,如果模塊sound.filters.vocoder 要使用包 sound.effects 中的模塊 echo,你就要寫成 from sound.effects import echo。

from . import echo
from .. import formats
from ..filters import equalizer

無論是隱式的還是顯式的相對導入都是從當前模塊開始的。主模塊的名字永遠是"__main__",一個Python應用程序的主模塊,應當總是使用絕對路徑引用。

包還提供一個額外的屬性__path__。這是一個目錄列表,裏面每一個包含的目錄都有爲這個包服務的__init__.py,你得在其他__init__.py被執行前定義哦。可以修改這個變量,用來影響包含在包裏面的模塊和子包。

這個功能並不常用,一般用來擴展包裏面的模塊。

Python3 輸入和輸出

在前面幾個章節中,我們其實已經接觸了 Python 的輸入輸出的功能。本章節我們將具體介紹 Python 的輸入輸出。

輸出格式美化

Python兩種輸出值的方式: 表達式語句和 print() 函數。

第三種方式是使用文件對象的 write() 方法,標準輸出文件可以用 sys.stdout 引用。

 

如果你希望輸出的形式更加多樣,可以使用 str.format() 函數來格式化輸出值。

如果你希望將輸出的值轉成字符串,可以使用 repr() 或 str() 函數來實現。

  • str(): 函數返回一個用戶易讀的表達形式。
  • repr(): 產生一個解釋器易讀的表達形式。

例如

>>> s = 'Hello, Runoob'
>>> str(s)
'Hello, Runoob'
>>> repr(s)
"'Hello, Runoob'"
>>> str(1/7)
'0.14285714285714285'
>>> x = 10 * 3.25
>>> y = 200 * 200
>>> s = 'x 的值爲: ' + repr(x) + ',  y 的值爲:' + repr(y) + '...'
>>> print(s)
x 的值爲: 32.5,  y 的值爲:40000...
>>> #  repr() 函數可以轉義字符串中的特殊字符
... hello = 'hello, runoob\n'
>>> hellos = repr(hello)
>>> print(hellos)
'hello, runoob\n'
>>> # repr() 的參數可以是 Python 的任何對象
... repr((x, y, ('Google', 'Runoob')))
"(32.5, 40000, ('Google', 'Runoob'))"
s = 'Hello, Runoob'
print(str(s))  # str(): 函數返回一個用戶易讀的表達形式。
print(repr(s))  # repr(): 產生一個解釋器易讀的表達形式。
print(str(1 / 7))

x = 10 * 3.25
y = 200 * 200
s = 'x 的值爲: ' + repr(x) + ',  y 的值爲:' + repr(y) + '...'
print(s)

# repr() 函數可以轉義字符串中的特殊字符
hello = 'hello, runoob\n'
hellos = repr(hello)
print(hello)
print(hellos)
# repr() 的參數可以是 Python 的任何對象
mix = repr((x, y, ('Google', 'Runoob')))
print(mix)
Hello, Runoob
'Hello, Runoob'
0.14285714285714285
x 的值爲: 32.5,  y 的值爲:40000...
hello, runoob

'hello, runoob\n'
(32.5, 40000, ('Google', 'Runoob'))

這裏有兩種方式輸出一個平方立方的表:

>>> for x in range(1, 11):
...     print(repr(x).rjust(2), repr(x*x).rjust(3), end=' ')
...     # 注意前一行 'end' 的使用
...     print(repr(x*x*x).rjust(4))
...
 1   1    1
 2   4    8
 3   9   27
 4  16   64
 5  25  125
 6  36  216
 7  49  343
 8  64  512
 9  81  729
10 100 1000

>>> for x in range(1, 11):
...     print('{0:2d} {1:3d} {2:4d}'.format(x, x*x, x*x*x))
...
 1   1    1
 2   4    8
 3   9   27
 4  16   64
 5  25  125
 6  36  216
 7  49  343
 8  64  512
 9  81  729
10 100 1000
print("-------------------------------------------------------------")
for x in range(1, 11):
    print(repr(x).rjust(2), repr(x*x).rjust(3), end=' ')
    # 注意前一行 'end' 的使用
    print(repr(x*x*x).rjust(4))

print("-------------------------------------------------------------")

for x in range(1, 11):
    print('{0:2d} {1:3d} {2:4d}'.format(x, x*x, x*x*x))
-------------------------------------------------------------
 1   1    1
 2   4    8
 3   9   27
 4  16   64
 5  25  125
 6  36  216
 7  49  343
 8  64  512
 9  81  729
10 100 1000
-------------------------------------------------------------
 1   1    1
 2   4    8
 3   9   27
 4  16   64
 5  25  125
 6  36  216
 7  49  343
 8  64  512
 9  81  729
10 100 1000

注意:在第一個例子中, 每列間的空格由 print() 添加。

這個例子展示了字符串對象的 rjust() 方法, 它可以將字符串靠右, 並在左邊填充空格。

還有類似的方法, 如 ljust() 和 center()。 這些方法並不會寫任何東西, 它們僅僅返回新的字符串。

另一個方法 zfill(), 它會在數字的左邊填充 0,如下所示:

>>> '12'.zfill(5)
'00012'
>>> '-3.14'.zfill(7)
'-003.14'
>>> '3.14159265359'.zfill(5)
'3.14159265359'
print('12'.zfill(5))
print('-3.14'.zfill(7))
print('3.14159265359'.zfill(5))


00012
-003.14
3.14159265359

str.format() 的基本使用如下:

>>> print('{}網址: "{}!"'.format('菜鳥教程', 'www.runoob.com'))
菜鳥教程網址: "www.runoob.com!"
print('{}網址: "{}!"'.format('菜鳥教程', 'www.runoob.com'))


菜鳥教程網址: "www.runoob.com!"

括號及其裏面的字符 (稱作格式化字段) 將會被 format() 中的參數替換。

在括號中的數字用於指向傳入對象在 format() 中的位置,如下所示:

>>> print('{0} 和 {1}'.format('Google', 'Runoob'))
Google 和 Runoob
>>> print('{1} 和 {0}'.format('Google', 'Runoob'))
Runoob 和 Google
print('{0} 和 {1}'.format('Google', 'Runoob'))
print('{1} 和 {0}'.format('Google', 'Runoob'))



Google 和 Runoob
Runoob 和 Google

如果在 format() 中使用了關鍵字參數, 那麼它們的值會指向使用該名字的參數。

>>> print('{name}網址: {site}'.format(name='菜鳥教程', site='www.runoob.com'))
菜鳥教程網址: www.runoob.com
print('{name}網址: {site}'.format(name='菜鳥教程', site='www.runoob.com'))


菜鳥教程網址: www.runoob.com

位置及關鍵字參數可以任意的結合:

>>> print('站點列表 {0}, {1}, 和 {other}。'.format('Google', 'Runoob', other='Taobao'))
站點列表 Google, Runoob, 和 Taobao。
print('站點列表 {0}, {1}, 和 {other}。'.format('Google', 'Runoob', other='Taobao'))


站點列表 Google, Runoob, 和 Taobao。

!a (使用 ascii()), !s (使用 str()) 和 !r (使用 repr()) 可以用於在格式化某個值之前對其進行轉化:

>>> import math
>>> print('常量 PI 的值近似爲: {}。'.format(math.pi))
常量 PI 的值近似爲: 3.141592653589793。
>>> print('常量 PI 的值近似爲: {!r}。'.format(math.pi))
常量 PI 的值近似爲: 3.141592653589793。
print('常量 PI 的值近似爲: {}。'.format(math.pi))
print('常量 PI 的值近似爲: {!r}。'.format(math.pi))
常量 PI 的值近似爲: 3.141592653589793。
常量 PI 的值近似爲: 3.141592653589793。

可選項 : 和格式標識符可以跟着字段名。 這就允許對值進行更好的格式化。 下面的例子將 Pi 保留到小數點後三位:

>>> import math
>>> print('常量 PI 的值近似爲 {0:.3f}。'.format(math.pi))
常量 PI 的值近似爲 3.142。

在 : 後傳入一個整數, 可以保證該域至少有這麼多的寬度。 用於美化表格時很有用。

>>> table = {'Google': 1, 'Runoob': 2, 'Taobao': 3}
>>> for name, number in table.items():
...     print('{0:10} ==> {1:10d}'.format(name, number))
...
Google     ==>          1
Runoob     ==>          2
Taobao     ==>          3
table = {'Google': 1, 'Runoob': 2, 'Taobao': 3}
for name, number in table.items():
    print('{0:10} ==> {1:10d}'.format(name, number))
Google     ==>          1
Runoob     ==>          2
Taobao     ==>          3

如果你有一個很長的格式化字符串, 而你不想將它們分開, 那麼在格式化時通過變量名而非位置會是很好的事情。

最簡單的就是傳入一個字典, 然後使用方括號 [] 來訪問鍵值 :

>>> table = {'Google': 1, 'Runoob': 2, 'Taobao': 3}
>>> print('Runoob: {0[Runoob]:d}; Google: {0[Google]:d}; Taobao: {0[Taobao]:d}'.format(table))
Runoob: 2; Google: 1; Taobao: 3
table = {'Google': 1, 'Runoob': 2, 'Taobao': 3}
print('Runoob: {0[Runoob]:d}; Google: {0[Google]:d}; Taobao: {0[Taobao]:d}'.format(table))


Runoob: 2; Google: 1; Taobao: 3

也可以通過在 table 變量前使用 ** 來實現相同的功能:

>>> table = {'Google': 1, 'Runoob': 2, 'Taobao': 3}
>>> print('Runoob: {Runoob:d}; Google: {Google:d}; Taobao: {Taobao:d}'.format(**table))
Runoob: 2; Google: 1; Taobao: 3
table = {'Google': 1, 'Runoob': 2, 'Taobao': 3}
print('Runoob: {Runoob:d}; Google: {Google:d}; Taobao: {Taobao:d}'.format(**table))

Runoob: 2; Google: 1; Taobao: 3

舊式字符串格式化

% 操作符也可以實現字符串格式化。 它將左邊的參數作爲類似 sprintf() 式的格式化字符串, 而將右邊的代入, 然後返回格式化後的字符串. 例如:

>>> import math
>>> print('常量 PI 的值近似爲:%5.3f。' % math.pi)
常量 PI 的值近似爲:3.142。

因爲 str.format() 比較新的函數, 大多數的 Python 代碼仍然使用 % 操作符。但是因爲這種舊式的格式化最終會從該語言中移除, 應該更多的使用 str.format().

讀取鍵盤輸入

Python提供了 input() 內置函數從標準輸入讀入一行文本,默認的標準輸入是鍵盤。

input 可以接收一個Python表達式作爲輸入,並將運算結果返回。

str = input("請輸入:")
print("你輸入的內容是: ", str)

請輸入:66
你輸入的內容是:  66

這會產生如下的對應着輸入的結果:

請輸入:菜鳥教程
你輸入的內容是:  菜鳥教程

讀和寫文件

open() 將會返回一個 file 對象,基本語法格式如下:

open(filename, mode)
  • filename:包含了你要訪問的文件名稱的字符串值。
  • mode:決定了打開文件的模式:只讀,寫入,追加等。所有可取值見如下的完全列表。這個參數是非強制的,默認文件訪問模式爲只讀(r)。

不同模式打開文件的完全列表:

模式 描述
r 以只讀方式打開文件。文件的指針將會放在文件的開頭。這是默認模式。
rb 以二進制格式打開一個文件用於只讀。文件指針將會放在文件的開頭。
r+ 打開一個文件用於讀寫。文件指針將會放在文件的開頭。
rb+ 以二進制格式打開一個文件用於讀寫。文件指針將會放在文件的開頭。
w 打開一個文件只用於寫入。如果該文件已存在則打開文件,並從開頭開始編輯,即原有內容會被刪除。如果該文件不存在,創建新文件。
wb 以二進制格式打開一個文件只用於寫入。如果該文件已存在則打開文件,並從開頭開始編輯,即原有內容會被刪除。如果該文件不存在,創建新文件。
w+ 打開一個文件用於讀寫。如果該文件已存在則打開文件,並從開頭開始編輯,即原有內容會被刪除。如果該文件不存在,創建新文件。
wb+ 以二進制格式打開一個文件用於讀寫。如果該文件已存在則打開文件,並從開頭開始編輯,即原有內容會被刪除。如果該文件不存在,創建新文件。
a 打開一個文件用於追加。如果該文件已存在,文件指針將會放在文件的結尾。也就是說,新的內容將會被寫入到已有內容之後。如果該文件不存在,創建新文件進行寫入。
ab 以二進制格式打開一個文件用於追加。如果該文件已存在,文件指針將會放在文件的結尾。也就是說,新的內容將會被寫入到已有內容之後。如果該文件不存在,創建新文件進行寫入。
a+ 打開一個文件用於讀寫。如果該文件已存在,文件指針將會放在文件的結尾。文件打開時會是追加模式。如果該文件不存在,創建新文件用於讀寫。
ab+ 以二進制格式打開一個文件用於追加。如果該文件已存在,文件指針將會放在文件的結尾。如果該文件不存在,創建新文件用於讀寫。

下圖很好的總結了這幾種模式:

模式 r r+ w w+ a a+
+ +   +   +
  + + + + +
創建     + + + +
覆蓋     + +    
指針在開始 + + + +    
指針在結尾         + +

以下實例將字符串寫入到文件 foo.txt 中:


# 打開一個文件
f = open("/tmp/foo.txt", "w")

f.write( "Python 是一個非常好的語言。\n是的,的確非常好!!\n" )

# 關閉打開的文件
f.close()
  • 第一個參數爲要打開的文件名。
  • 第二個參數描述文件如何使用的字符。 mode 可以是 'r' 如果文件只讀, 'w' 只用於寫 (如果存在同名文件則將被刪除), 和 'a' 用於追加文件內容; 所寫的任何數據都會被自動增加到末尾. 'r+' 同時用於讀寫。 mode 參數是可選的; 'r' 將是默認值。

此時打開文件 foo.txt,顯示如下:

$ cat /tmp/foo.txt 
Python 是一個非常好的語言。
是的,的確非常好!!

文件對象的方法

本節中剩下的例子假設已經創建了一個稱爲 f 的文件對象。

f.read()

爲了讀取一個文件的內容,調用 f.read(size), 這將讀取一定數目的數據, 然後作爲字符串或字節對象返回。

size 是一個可選的數字類型的參數。 當 size 被忽略了或者爲負, 那麼該文件的所有內容都將被讀取並且返回。

以下實例假定文件 foo.txt 已存在(上面實例中已創建):

# 打開一個文件
f = open("/tmp/foo.txt", "r")

str = f.read()
print(str)

# 關閉打開的文件
f.close()

執行以上程序,輸出結果爲:

Python 是一個非常好的語言。
是的,的確非常好!!

f.readline()

f.readline() 會從文件中讀取單獨的一行。換行符爲 '\n'。f.readline() 如果返回一個空字符串, 說明已經已經讀取到最後一行。

# 打開一個文件
f = open("/tmp/foo.txt", "r")

str = f.readline()
print(str)

# 關閉打開的文件
f.close()

執行以上程序,輸出結果爲:

Python 是一個非常好的語言。

f.readlines()

f.readlines() 將返回該文件中包含的所有行。

如果設置可選參數 sizehint, 則讀取指定長度的字節, 並且將這些字節按行分割。

# 打開一個文件
f = open("/tmp/foo.txt", "r")

str = f.readlines()
print(str)

# 關閉打開的文件
f.close()

執行以上程序,輸出結果爲:

['Python 是一個非常好的語言。\n', '是的,的確非常好!!\n']

另一種方式是迭代一個文件對象然後讀取每行:

# 打開一個文件
f = open("/tmp/foo.txt", "r")

for line in f:
    print(line, end='')

# 關閉打開的文件
f.close()

執行以上程序,輸出結果爲:

Python 是一個非常好的語言。
是的,的確非常好!!

這個方法很簡單, 但是並沒有提供一個很好的控制。 因爲兩者的處理機制不同, 最好不要混用。

f.write()

f.write(string) 將 string 寫入到文件中, 然後返回寫入的字符數。


# 打開一個文件
f = open("/tmp/foo.txt", "w")

num = f.write( "Python 是一個非常好的語言。\n是的,的確非常好!!\n" )
print(num)
# 關閉打開的文件
f.close()

執行以上程序,輸出結果爲:

29

如果要寫入一些不是字符串的東西, 那麼將需要先進行轉換:

# 打開一個文件
f = open("/tmp/foo1.txt", "w")

value = ('www.runoob.com', 14)
s = str(value)
f.write(s)

# 關閉打開的文件
f.close()

執行以上程序,打開 foo1.txt 文件:

$ cat /tmp/foo1.txt 
('www.runoob.com', 14)

f.tell()

f.tell() 返回文件對象當前所處的位置, 它是從文件開頭開始算起的字節數。

f.seek()

如果要改變文件當前的位置, 可以使用 f.seek(offset, from_what) 函數。

from_what 的值, 如果是 0 表示開頭, 如果是 1 表示當前位置, 2 表示文件的結尾,例如:

 

  • seek(x,0) : 從起始位置即文件首行首字符開始移動 x 個字符
  • seek(x,1) : 表示從當前位置往後移動x個字符
  • seek(-x,2):表示從文件的結尾往前移動x個字符

from_what 值爲默認爲0,即文件開頭。下面給出一個完整的例子:

>>> f = open('/tmp/foo.txt', 'rb+')
>>> f.write(b'0123456789abcdef')
16
>>> f.seek(5)     # 移動到文件的第六個字節
5
>>> f.read(1)
b'5'
>>> f.seek(-3, 2) # 移動到文件的倒數第三字節
13
>>> f.read(1)
b'd'

f.close()

在文本文件中 (那些打開文件的模式下沒有 b 的), 只會相對於文件起始位置進行定位。

當你處理完一個文件後, 調用 f.close() 來關閉文件並釋放系統的資源,如果嘗試再調用該文件,則會拋出異常。

>>> f.close()
>>> f.read()
Traceback (most recent call last):
  File "<stdin>", line 1, in ?
ValueError: I/O operation on closed file

當處理一個文件對象時, 使用 with 關鍵字是非常好的方式。在結束後, 它會幫你正確的關閉文件。 而且寫起來也比 try - finally 語句塊要簡短:

>>> with open('/tmp/foo.txt', 'r') as f:
...     read_data = f.read()
>>> f.closed
True

文件對象還有其他方法, 如 isatty() 和 trucate(), 但這些通常比較少用。

pickle 模塊

python的pickle模塊實現了基本的數據序列和反序列化。

通過pickle模塊的序列化操作我們能夠將程序中運行的對象信息保存到文件中去,永久存儲。

通過pickle模塊的反序列化操作,我們能夠從文件中創建上一次程序保存的對象。

基本接口:

pickle.dump(obj, file, [,protocol])

有了 pickle 這個對象, 就能對 file 以讀取的形式打開:

x = pickle.load(file)

註解:從 file 中讀取一個字符串,並將它重構爲原來的python對象。

file: 類文件對象,有read()和readline()接口。

# 使用pickle模塊將數據對象保存到文件
data1 = {'a': [1, 2.0, 3, 4+6j],
         'b': ('string', u'Unicode string'),
         'c': None}

selfref_list = [1, 2, 3]
selfref_list.append(selfref_list)

output = open('data.pkl', 'wb')

# Pickle dictionary using protocol 0.
pickle.dump(data1, output)

# Pickle the list using the highest protocol available.
pickle.dump(selfref_list, output, -1)

output.close()
import pprint, pickle

#使用pickle模塊從文件中重構python對象
pkl_file = open('data.pkl', 'rb')

data1 = pickle.load(pkl_file)
pprint.pprint(data1)

data2 = pickle.load(pkl_file)
pprint.pprint(data2)

pkl_file.close()

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章