原创 基於python的-scrapy框架的基本用法

# -*- coding:utf-8 -*- # spiders 該文件夾專門存放爬蟲文件 # items.py 用於存儲爬蟲的數據 # middlewares.py 用於處理爬蟲前的請求和響應,例如設置headers # pipeli

原创 基於python的-內存管理

# -*- coding:utf-8 -*- # python 中是自動管理內存的 # 自動管理內存編程語言,例如:object-c python # 手動管理內存編程語言,例如:C # Python 中的內存管理採用的'引用計數'的

原创 基於python的-正則中的函數

# -*- coding:utf-8 -*- import re # 1. match() # 2. search() string = 'hell8oworldhe8llo,h4e,hell,h6ool' pattern = re

原创 基於python的-Random_Agent

# -*- coding:utf-8 -*-import randomclass RandomAgent(object): agent_list = [ "Mozilla/5.0 (Windows; U; Window

原创 基於python的-get和post請求

# -*- coding:utf-8 -*- # import urllib # import urllib2 # import urllib3 # import http import requests # 1. 使用reques

原创 基於python的-網頁解析方式(xpath)

# -*- coding:utf-8 -*- """ 1.網頁的解析方式 1) xpath(簡單) 2) 正則(最難) 3) css(需要懂網頁的css) 4) b

原创 基於python的-反反爬蟲手段

# -*- coding:utf-8 -*- import requests # 抓包工具 # charles # fiddler # 參數1: url,填網址 # 參數2: params,網址後需要添加的參數 # 參數3: **kw

原创 基於python的-正則模式

# -*- coding:utf-8 -*- import re string = ''' aaaaaa ssss dd f aasd ''' # re.S 作用就是會將大字符

原创 基於python的-爬取風景圖片網圖片

# -*- coding:utf-8 -*- # 獲取網頁源碼/下載網頁/圖片/視頻/音頻.. import requests # 解析網頁相關數據 from lxml import etree # 操作文件夾/路徑 import

原创 基於python的-正則表達式

# -*- coding:utf-8 -*- # re模塊是python中內置的用啦支持正則表達式的模塊 import re string = 'hello world' # 1.準備正則 pattern = re.compile

原创 基於python的-SQlite數據庫

# -*- coding:utf-8 -*- # sqlite3是python中內置的一個輕量級的數據庫 # 數據庫用來保存大量的,格式統一的數據,比如name,age,id,在數據庫中一般會有多張 # 表,將數據保存到表中 impor

原创 基於python的-cookie

# -*- coding:utf-8 -*- import requests # Cookie: 小蛋糕,餅乾 # 特點: # 1.用於存儲用戶的某些信息 # 2.只用於存儲少量數據 # 3.cookie是個文件,位於瀏覽器 # url

原创 基於python的-SQlite數據庫練習

# -*- coding:utf-8 -*- import sqlite3 connect = sqlite3.connect('test.db') cursor = connect.cursor() # 1,創建一個學生成績表 Gr

原创 基於python的-時間模塊

# coding:utf-8 # 時間 日期 # datetime 日期 模塊 import datetime # datetime.datetime 這是模塊中的類 today = datetime.datetime.now() pr

原创 基於python的-get和post的區別

# -*- coding:utf-8 -*- # 面試題 # GET和POST的區別 # 1.參數位置 # GET: 參數一般位於URL後面 # POST: 參數一般位於請求體中 # 2.數據長度 # GET: 長度有限