一、
運行selenium自動化爬取內容
安裝Chrome driver 需要權限
http://blog.csdn.net/u012359618/article/details/52556127
二、Scrapy框架
安裝scrapy
三、Python3 默認utf-8
四、For只能用於容器
五、Lambda簡化代碼結構
f( lambda x:x+100,100)
六、list 數組
list=[1,2,3]
for I in list:
print (i)
用range模擬for
Range(x)à[0,x-1]
Range(x,y)__>[x,y-1]
Range(x,y,z)à[x,x+z,…<y-1]
For I in range(len(li))
負數索引提高代碼效率
List[-1]
For I in range(3,-1,-1)
Print(i)
申明:
List=[]
List.append(1)
按元素添加數組
Li=[1,2]
Li2=[3,4,5]
li.append(li2)
[1, 2, [3, 4]]
用extend,li.extend(li2)
[1, 2, [3, 4], 3, 4]
刪除
Li.pop()刪除最後一個元素
Li.pop(2)刪除指定元素
排序
必須先排序再輸出
list.sort()
print (list)
利用lambda幫助排序
七、Set
不重複
八、字典
Dictionary
For k in di:
Print(di[k])
For k , v in di.items():
Print(k,v)
九、切片
數組切片
數組
字符串是一個特殊的數組
#加字符串
li=list(str)
li[0]='x'
str=''.join(li)
print(str)
str='-'.join(li)
print(str)
#切片
s='asd,sdd,dsf'
p1,p2,p3=s.split(',')
print(p1,p2,p3)
十、object
用type 查看對象類型
用dir查看屬性和方法
Print(dir(list))
申明成員函數的時候,第一個參數一定是self
鴨子類型:Dark type
十一、 讀取文件兩個方法,一般用with
f=open('t_sales_sum.csv','r')
#print(f.readline())
for linein f.readlines():
print(line.strip())
withopen('t_sales_sum.csv') as f:
for line in f.readlines():
print(line)
上級的文件一個個讀,read(start,offset,size)
十二、 多線程
多線程重複
有多少cpu啓多少線程
十三、 錯誤和異常處理