Ubuntu下實現scrapy定時爬取

原創

2020-05-02 08:41

基本需求

我製作的爬蟲需求是一小時執行一次，爬蟲要放在服務器上，服務器是ubuntu64位系統

具體步驟

1.啓動cron服務

在Ubuntu下cron服務是默認啓動的，如果沒有啓動，請自行百度搜索如何啓動，我的是啓動的~。

2.開啓cron日誌系統

1.修改rsyslog文件 vim /etc/rsyslog.d/50-default.conf
將 cron.*前面的 #去掉，解除註釋

2.重啓rsyslog服務service rsyslog restart
3.重啓cron服務service cron restart

3.編寫腳本執行scrapy命令

我的腳本是放在/home/shScripts/目錄下的
新建一個腳本，我的叫scrapy.sh,鍵入代碼
注意，坑來了。
你的crontab執行命令時的環境和你主機並不是同一環境。所以這樣執行會出問題，會找不到scrapy命令，所以你要使用絕對路徑來執行scrapy
看看你的scrapy命令在哪。

找到你的scrapy之後再重新寫入腳本

export PATH=$PATH:/usr/local/bin

echo$PATH
cd /home/COVID_19/
/root/anaconda3/bin/scrapy crawl covid19 >> covid19.log 2>&1 &

4.使用crontab創建定時任務

其實會出現一個讓你選擇一個編輯器來編輯命令的選項畫面，因爲我的選擇過，所以沒有了，附上一張從別人博客拷貝過來的圖

按數字選擇你的編輯器即可

添加一條腳本的執行命令

0 * * * * sh /home/shScrpits/scrapy.sh

關於crontab的定時格式，網上整理的亂七八糟。其他的我也不太清楚，建議各位再搜一搜，反正我這個0 * * * * 是代表一小時執行一次。

編輯完成之後保存，大功告成。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

利用pyinstaller打包Python程序爲一個可執行文件

有時，Python發佈的程序需要被打包爲一個文件夾、甚至一個文件發佈。目前（2020）最佳的策略是使用pyinstaller。 pyinstaller不僅支持打包整個運行環境到一個可執行文件，而且還支持加密。但唯一的問題是，必須依賴

2024-05-14 02:04:34

昔日輝煌不再，PHP老矣，尚能飯否？

導語 | 近期 TIOBE 最新指數顯示，PHP 的流行度降至了歷史最低，排在第 17 名，同時，在年度 Stack Overflow 開發者調查報告中，PHP 在開發者中的受歡迎程度已經從之前的約 30% 萎縮至現在的 18%。“P

2024-05-23 23:48:42

一文教你基於LangChain和ChatGLM3搭建本地知識庫問答

本文分享自華爲雲社區《【雲駐共創】LangChain＋ChatGLM3實現本地知識庫，轉華爲雲ModelArts，實現大模型AI應用開發》，作者：葉一一。一、前言本期華爲雲的講師是華爲雲EI開發生態的工程師傑森，分享主題是：基於La

2024-05-23 10:58:28

Python實現大麥網搶票的四大關鍵技術點解析

前言隨着互聯網的普及和發展，線上購票已經成爲人們生活中不可或缺的一部分。然而，在搶購熱門演出門票時，往往會遇到搶票難、搶票快的問題，有時候一秒鐘的延遲就意味着與心儀的演出擦肩而過。爲了解決這個問題，技術愛好者們開始探索利用Python

2024-05-23 00:18:04

用python開發一個類似的交互查詢系統.用什麼庫方便？

大家好，我是Python進階者。一、前言前幾天在Python白銀交流羣【fashjon】問了一個Python庫的問題，問題如下：用python開發一個類似的交互查詢系統.用什麼庫方便？二、實現過程這裏【啥也不懂】給了一個指導：PY

2024-05-22 10:02:33

Selenium與PhantomJS：自動化測試與網頁爬蟲的完美結合

在當今互聯網時代，自動化測試和網頁爬蟲技術成爲了不可或缺的工具，它們不僅提高了開發效率，也爲數據採集和分析提供了便利。而Selenium與PhantomJS的結合，則爲這兩個領域的應用帶來了全新的可能性。本文將介紹Selenium與Pha

2024-05-22 00:09:17

用好AppBuilder-SDK，每天都能偷偷早下班

本文主要是對這次AppBuilder-SDK直播課程的文字總結，主題是如何在Python中使用AppBuilder-SDK（使用的IDE 爲 PyCharm社區版）感興趣的朋友也可以去看直播課回放。直播課： AppBuil

2024-05-21 12:12:15

Shell/Python中的用戶名獲取

一、幾個基本概念登錄用戶（login user）：通過登錄方式進入系統的用戶，強調登錄身份。當前用戶（current user）：執行一個進程或者命令時所使用的用戶身份，強調執行身份。舉

2024-05-19 00:44:35

網絡爬蟲的祕密：如何高效地抓取JD.com視頻鏈接

在這個數據驅動的時代，信息就是力量。而在這片信息的海洋中，爬蟲技術就像是一艘靈活的潛水艇，讓我們能夠深入海底，探尋那些隱藏的寶藏。今天，我將帶領大家一起踏上一場奇妙的探險之旅，我們將使用Python這把瑞士軍刀，搭配RoboBrowser

2024-05-18 00:07:59

記一次有點抽象的滲透經歷

0x01 獲取webshell 在各種信息蒐集中，發現某個ip的端口掛着一個比較老的服務。首先看到了員工工號和手機號的雙重驗證，也不知道賬號是什麼結構組成的，基本上放棄字典爆破這一條路。於是乎打開之前用燈塔的掃描結果，看看文件泄露是否

2024-05-17 23:16:30

地理數據可視化的神奇組合：Python和Geopandas

本文分享自華爲雲社區《Python與Geopandas：地理數據可視化與分析指南》，作者：檸檬味擁抱。地理數據可視化在許多領域都是至關重要的，無論是研究地理空間分佈、城市規劃、環境保護還是商業決策。Python語言以其強大的數據處理和可視

2024-05-15 10:59:41

Scrapy爬蟲：利用代理服務器爬取熱門網站數據

在當今數字化時代，互聯網上充斥着大量寶貴的數據資源，而爬蟲技術作爲一種高效獲取網絡數據的方式，受到了廣泛的關注和應用。本文將介紹如何使用Scrapy爬蟲框架，結合代理服務器，實現對熱門網站數據的高效爬取，以抖音爲案例進行說明。 1. 簡

2024-05-15 00:08:57

Python函數與模塊的精髓與高級特性

本文分享自華爲雲社區《Python函數與模塊的精髓與高級特性》，作者：檸檬味擁抱。 Python 是一種功能強大的編程語言，擁有豐富的函數和模塊，使得開發者能夠輕鬆地構建複雜的應用程序。本文將介紹 Python 中函數和模塊的基本使用方法，

2024-05-14 11:00:07

做開發我是認真的！要麼不做，要麼全力以赴 | 每日趣聞

戳一戳小程序查看更多！往期趣聞 ☞你拖後腿了嗎？11 月份程序員工資出爐~ | 每日趣聞 ☞計算機專業會修電腦實錘！| 每日趣聞 ☞IT 行業這麼廣，你的職業規劃是什麼？| 每日趣聞 ☞奔潰啦~希望 Python 可

2024-05-14 01:47:34

在Linux操作系統的安裝過程中，如何選擇合適的發行版

【關鍵詞】{{linux安裝}} 【提問】{{question}} 在Linux操作系統的安裝過程中，如何選擇合適的發行版，並確保安裝過程順利進行？此外，對於不同硬件配置的用戶，有哪些特定的安裝注意事項和優化策略？【文章】{{Linux操

2024-05-17 01:49:06

24小時熱門文章

最新文章

最新評論文章