獲取百度貼吧的裏QQ號

原創

自學號

2018-09-10 03:39

import urllib.request

import re as gg

import os,string,sys

import easygui as g

result = []

#urllib.urlopen(url) 獲取網頁源碼函數

#urllib.urlretrieve(url,'存儲名字') 將網頁資源下載到本地函數

def getyuanma(_url):

page = urllib.request.urlopen(_url).read()

page1 = page.decode('UTF-8') ##轉換編碼

f = open(r'C:\Users\Administrator\Desktop\python\爬蟲\源碼1.txt','w',encoding='utf-8')

f.write(str(page1))

f.close()

def getQQnum(file_url):

f1 = open(file_url,'r',encoding='utf-8')

for i in f1:

p = gg.findall(r'([0-9]{8,11}\@[0-9a-zA-Z]{0,10}.{0,4})',i)

if len(p) != 0:

print(p)

def getyeshu(file_url):

f2 = open(file_url,'r',encoding='utf-8')

for i in f2:

p = gg.findall(r'pn=([0-9]{1,3})\">尾頁',i)

if len(p) != 0:

_num = p[0]

return _num

break

def main():

_url1 = g.enterbox("請輸入鏈接地址：","輸入地址")

getyuanma(_url1)

print(_url1)

_num = getyeshu(r'C:\Users\Administrator\Desktop\python\爬蟲\源碼1.txt')

if _num != None:

for i in range(1,int(_num)+1):

print(i)

getyuanma(_url1+r'?pn='+str(i))

getQQnum(r'C:\Users\Administrator\Desktop\python\爬蟲\源碼1.txt')

main()

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

獲取百度貼吧的裏QQ號

釘釘打卡速度慢

Nginx R31 doc 官方文檔-01-nginx 如何安裝

Python 潮流週刊#51：用 Python 繪製美觀的圖表

Qt/C++音視頻開發74-合併標籤圖形/生成yolo運算結果圖形/文字和圖形合併成一個/水印濾鏡

挑戰程序設計競賽 2.2章習題 POJ - 3617 Best Cow Line 貪心

字節面試：MySQL什麼時候鎖表？如何防止鎖表？

.NET8連接SQL SERVER 2008 R2 報：證書鏈是由不受信任的頒發機構頒發的

golang開發環境搭建(win10)

python計算機視覺學習筆記——PIL庫的用法

Golang初學：獲取程序內存使用情況，std runtime

人工智能就該這麼學——人工智能全套學習課程

金融信貸風控中的機器學習

這有一份JavaEE企業級分佈式高級架構師課程，請查收

爲什麼要用golang語言進行區塊鏈編程開發？

Docker與Kubernetes，是敵是友？

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結