scrapy 將item存到mysql中（pymysql）

原創

time_tries_all

2020-06-07 01:39

本文將介紹如何將抓好的item數據存入到mysql中

聲明：本文使用的python交互工具爲pymysql並非mysqldb，因爲網上使用pymysql存入數據的相關文章較少，所以寫了這篇文章供大家參考

環境：ubantu

準備工作：

items.py

將想要抓的數據累出來，下面是我要抓的數據：（我的項目名爲wens）

class WensItem(scrapy.Item):
    # define the fields for your item here like:
    # name = scrapy.Field()
    img_url = scrapy.Field()
    name = scrapy.Field()
    update_time = scrapy.Field()
    update_word = scrapy.Field()
    author = scrapy.Field()

steam.py（我的爬蟲腳本）

當然也別忘了引入

from wens.items import WensItem

至此準備工作全部完成，本文主要闡述如何將抓好的數據存入數據庫，對於如何抓取數據不再贅述。

pipelines.py

import pymysql

class writeMysql(object):
    def __init__(self):
        self.client = pymysql.connect(
            host='127.0.0.1',
            port=3306,
            user='root',  #使用自己的用戶名 
            passwd='123',  # 使用自己的密碼
            db='chenguang',  # 數據庫名
            charset='utf8'   
        )
        self.cur = self.client.cursor()
    def process_item(self,item,spider):
        # sql = 'insert into game(img_url,name,update_time,update_word,author) VALUES (%s,%s,%s,%s,%s)'%(item['img_url'],item['name'],item['update_time'],item['update_word'],item['author'])
        #對於上條命令感覺和下面的sql語句相同，但是就是報語法錯誤，如果有大神知道希望能夠指出

	sql = 'insert into game(img_url,name,update_time,update_word,author) VALUES (%s,%s,%s,%s,%s)'
        lis = (item['img_url'],item['name'],item['update_time'],item['update_word'],item['author'])
        self.cur.execute(sql,lis)
        self.client.commit()
        # self.cur.close()
        # self.client.close()

	# 對於這裏如果關閉的話只能能插入一條數據，也不知道應該在哪裏關閉，還沒有弄出來，但是不關閉也沒影響
        return item

settings.py

別忘了在setting中註冊

ITEM_PIPELINES = {
   'wens.pipelines.writeMysql': 200,
}

最後建立數據庫，我是用navicat(懶)，創建數據庫及表的方法我就不貼出來了，需要注意的是創建的字段名需要和items.py中自己定義的相同。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

scrapy 將item存到mysql中（pymysql）

[轉帖]使用NMT和pmap解決JVM資源泄漏問題原創

Python實現大麥網搶票的四大關鍵技術點解析

Python 安裝庫指令大全

salesforce零基礎學習（一百三十八）零碎知識點小總結（十）

一款開源的.NET程序集反編譯、編輯和調試神器

關於接口協議，你必須要知道這些！

基於 Milvus + LlamaIndex 實現高級 RAG

【2024-05-21】以茶會友

ValueError: Missing scheme in request url: h

python中的JSON報錯：ValueError: Expecting property name

Ubuntu下打開Chrome出現輸入密碼以解鎖您的登錄密鑰環

Ubuntu 下修改MySQL的字符集爲UTF-8

windows系統清除電腦地址欄文件（夾）路徑

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結