爬取豆瓣電影py_sqlserver

原創

2020-06-14 23:22

近期因c#項目需要sqlserver大量數據準備python爬點數據

import requests
from bs4 import BeautifulSoup  # pip install beautifulsoup4


url = 'https://movie.douban.com/top250?start=0&filter='

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36'
}
response = requests.get(url=url, headers=headers)

html = response.text

mov_list=[]
with open('douban.txt', 'w', encoding='utf-8') as file:
    soup = BeautifulSoup(html, 'html.parser')
    # fp.write(name+':'+score+'\n')
    items = soup.find_all(class_="item")
    for i in items:
        title = i.find(class_='title').text
        playable = i.find(class_='playable')
        if playable: playable=playable.text
        bd=i.find(class_='bd').text.split()[1]
        star = i.find(class_='star').text.split()[0]
        inq = i.find(class_="inq").text
        print(title, '\n', playable, '\n',bd,'\n',star,'\n', inq)
        print('================')
        mov_list.append({'title':title,'bd':bd})

for x in mov_list:
    pass  #連接數據庫寫入

    break




#mysql示例       https://www.cnblogs.com/lin135/p/7807731.html
#sqlserver 示例 :https://blog.csdn.net/lin_strong/article/details/82868160

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Requests庫——實例講解

都是特別基礎的實例，每個用例都有他的意義。例子來源：《中國大學慕課》，北京理工大學嵩天老師的，Python爬蟲課程。看這篇文章之前，最好看一下Requests庫的詳細介紹。Python爬蟲入門——Requests庫 1.爬取京

2020-06-21 23:49:22

Python爬蟲入門——信息組織與提取方法（2）

1. 信息提取的一般方法指從標記的信息中提取關注的內容。上一章提到的信息標記有三種形式：XML、JSON、YAML。一般意義上的幾種方法: 方法一：完整的解析信息的標記形式，再提取關鍵信息。像XML、JSON、YAML等，

2020-06-21 23:08:03

Re（正則表達式）庫入門

1. 前言正則表達式（Regular Expression）又稱RegEx，是用來匹配字符的一種工具。在一大串字符中尋找你需要的內容，它常被用在很多方面。比如，網頁爬蟲、文稿整理、數據篩選等等。正則表達式絕對不是一天就能學會

2020-06-21 23:07:58

Python爬蟲學習之 Request

目錄 request 安裝簡單示例各種請求方式測試 get請求簡單get請求帶參數get 解析json 獲取二進制內容保存二進制內容添加headers post請求添加data表單數據和headers頭信息

凯撒网络研究院

2020-06-15 20:17:27

Python爬蟲之PyQuery

目錄安裝使用初始化字符串初始化 url初始化文件初始化基本CSS選擇器查找元素查找子元素查找父元素 parent parents 查找兄弟元素遍歷獲取文本獲取HTML DOM操作修改c

凯撒网络研究院

2020-06-15 20:17:27

使用selenium時出現 " FileNotFoundError: [WinError 2] 系統找不到指定的文件。" 的解決辦法。

2020-05-31 20:38:19

使用python中的requests爬取百度翻譯實現中英互譯功能

2020-05-31 20:38:19

Python爬蟲入門——信息組織與提取方法（1）

2020-02-23 23:17:08

Python爬蟲入門——Beautiful Soup庫的使用

2020-02-22 07:59:28

Python爬蟲入門——Requests庫

2020-02-22 07:59:28

Python 爬蟲求職計劃

現狀： 2019年之前從事C語言開發，現在剛接觸android開發，但是一直很喜歡Python，工作之餘有學習。目前的情況是Python基礎學過一遍，項目也有做，但總覺得有的地方沒喫透。離求職Python的崗位還是有點困難的。因此需要再鞏

2020-07-07 03:52:20

python3 selenium 登錄douban,獲取cookie

selenium登錄豆瓣流程: 1. 進入豆瓣登錄頁面 2. 切換到**子框架**,定位**用戶,密碼**輸入框. 並輸入數據,再**定位登錄**按鍵,點擊登錄. 3. 返回登錄成功後的cookies, 4. 關閉驅動瀏覽器.

2020-06-25 22:59:50

利用python編寫一個簡單的爬糗事百科熱圖爬蟲

python爬蟲，爬取糗事百科並保存到文件中以下是代碼實現部分，如果對你有幫助，留下一個贊 from urllib import request from lxml import etree from urllib import

赵北北北北北

2020-06-23 12:30:52

appium 尋找文本元素

1、通過文字尋找 find_element_by_android_uiautomator driver.find_element_by_android_uiautomator('text(\"按鈕\")').click()

2020-06-23 10:04:33

python + selemium 知識點總結

文章目錄1、元素查找 1、元素查找 (1)find_element_by_xpath 待續···

2020-06-23 10:04:32

24小時熱門文章

最新文章

最新評論文章