1、第一種辦法是最簡單又最暴力。那就是在一個死循環中,使用線程睡眠函數 sleep()。
from datetime import datetime
import time
'''
每個 10 秒打印當前時間。
'''
def timedTask():
while True:
print(datetime.now().strftime("%Y-%m-%d %H:%M:%S"))
time.sleep(10)
if __name__ == '__main__':
timedTask()
這種方法能夠執行固定間隔時間的任務。如果timedTask()函數之後還有些操作,我們還使用死循環 + 阻塞線程。這會使得timedTask()一直佔有 CPU 資源,導致後續操作無法執行。我建議謹重使用。
2、既然第一種方法暴力,那麼有沒有比較優雅地方法?答案是肯定的。Python 標準庫 threading 中有個 Timer 類。它會新啓動一個線程來執行定時任務,所以它是非阻塞函式。
如果你有使用多線程的話,需要關心線程安全問題。那麼你可以選使用threading.Timer模塊。
from datetime import datetime
from threading import Timer
import time
'''
每個 10 秒打印當前時間。
'''
def timedTask():
'''
第一個參數: 延遲多長時間執行任務(單位: 秒)
第二個參數: 要執行的任務, 即函數
第三個參數: 調用函數的參數(tuple)
'''
Timer(10, task, ()).start()
# 定時任務
def task():
print(datetime.now().strftime("%Y-%m-%d %H:%M:%S"))
if __name__ == '__main__':
timedTask()
while True:
print(time.time())
time.sleep(5)
運行結果:
1512486945.1196375
1512486950.119873
2017-12-05 23:15:50
1512486955.133385
3、使用標準庫中sched模塊。sched 是事件調度器,它通過 scheduler 類來調度事件,從而達到定時執行任務的效果。
sched庫使用起來也是非常簡單。
1)首先構造一個sched.scheduler類
它接受兩個參數:timefunc和 delayfunc。timefunc 應該返回一個數字,代表當前時間,delayfunc 函數接受一個參數,用於暫停運行的時間單元。
一般使用默認參數就行,即傳入這兩個參數 time.time 和 time.sleep.當然,你也可以自己實現時間暫停的函數。
2)添加調度任務
scheduler 提供了兩個添加調度任務的函數:
enter(delay, priority, action, argument=(), kwargs={})
1
該函數可以延遲一定時間執行任務。delay 表示延遲多長時間執行任務,單位是秒。priority爲優先級,越小優先級越大。兩個任務指定相同的延遲時間,優先級大的任務會向被執行。action 即需要執行的函數,argument 和 kwargs 分別是函數的位置和關鍵字參數。
scheduler.enterabs(time, priority, action, argument=(), kwargs={})
1
添加一項任務,但這個任務會在 time 這時刻執行。因此,time 是絕對時間.其他參數用法與 enter() 中的參數用法是一致。
3)把任務運行起來
調用 scheduler.run()函數就完事了。
下面是 sche 使用的簡單示例:
from datetime import datetime
import sched
import time
'''
每個 10 秒打印當前時間。
'''
def timedTask():
# 初始化 sched 模塊的 scheduler 類
scheduler = sched.scheduler(time.time, time.sleep)
# 增加調度任務
scheduler.enter(10, 1, task)
# 運行任務
scheduler.run()
# 定時任務
def task():
print(datetime.now().strftime("%Y-%m-%d %H:%M:%S"))
if __name__ == '__main__':
timedTask()
值得注意的是: scheduler 中的每個調度任務只會工作一次,不會無限循環被調用。如果想重複執行同一任務, 需要重複添加調度任務即可。
上面三種辦法能實現定時任務,但是都無法做到循環執行定時任務。因此,需要一個能夠擔當此重任的庫。它就是APScheduler。
1 簡介
APScheduler的全稱是Advanced Python Scheduler。它是一個輕量級的 Python 定時任務調度框架。APScheduler 支持三種調度任務:固定時間間隔,固定時間點(日期),Linux 下的 Crontab 命令。同時,它還支持異步執行、後臺執行調度任務。
2 安裝
使用 pip 包管理工具安裝 APScheduler 是最方便快捷的。
pip install APScheduler
# 如果出現因下載失敗導致安裝不上的情況,建議使用代理
pip --proxy http://代理ip:端口 install APScheduler
3 使用步驟
APScheduler 使用起來還算是比較簡單。運行一個調度任務只需要以下三部曲。
新建一個 schedulers (調度器) 。
添加一個調度任務(job stores)。
運行調度任務。
下面是執行每 2 秒報時的簡單示例代碼:
import datetime
import time
from apscheduler.schedulers.background import BackgroundScheduler
def timedTask():
print(datetime.datetime.utcnow().strftime("%Y-%m-%d %H:%M:%S.%f")[:-3])
if __name__ == '__main__':
# 創建後臺執行的 schedulers
scheduler = BackgroundScheduler()
# 添加調度任務
# 調度方法爲 timedTask,觸發器選擇 interval(間隔性),間隔時長爲 2 秒
scheduler.add_job(timedTask, 'interval', seconds=2)
# 啓動調度任務
scheduler.start()
while True:
print(time.time())
time.sleep(5)
4 基礎組件
APScheduler 有四種組件,分別是:調度器(scheduler),作業存儲(job store),觸發器(trigger),執行器(executor)。
schedulers(調度器)
它是任務調度器,屬於控制器角色。它配置作業存儲器和執行器可以在調度器中完成,例如添加、修改和移除作業。
triggers(觸發器)
描述調度任務被觸發的條件。不過觸發器完全是無狀態的。
job stores(作業存儲器)
任務持久化倉庫,默認保存任務在內存中,也可將任務保存都各種數據庫中,任務中的數據序列化後保存到持久化數據庫,從數據庫加載後又反序列化。
executors(執行器)
負責處理作業的運行,它們通常通過在作業中提交指定的可調用對象到一個線程或者進城池來進行。當作業完成時,執行器將會通知調度器。
4.1 schedulers(調度器)
我個人覺得 APScheduler 非常好用的原因。它提供 7 種調度器,能夠滿足我們各種場景的需要。例如:後臺執行某個操作,異步執行操作等。調度器分別是:
BlockingScheduler : 調度器在當前進程的主線程中運行,也就是會阻塞當前線程。
BackgroundScheduler : 調度器在後臺線程中運行,不會阻塞當前線程。
AsyncIOScheduler : 結合 asyncio 模塊(一個異步框架)一起使用。
GeventScheduler : 程序中使用 gevent(高性能的Python併發框架)作爲IO模型,和 GeventExecutor 配合使用。
TornadoScheduler : 程序中使用 Tornado(一個web框架)的IO模型,用 ioloop.add_timeout 完成定時喚醒。
TwistedScheduler : 配合 TwistedExecutor,用 reactor.callLater 完成定時喚醒。
QtScheduler : 你的應用是一個 Qt 應用,需使用QTimer完成定時喚醒。
4.2 triggers(觸發器)
APScheduler 有三種內建的 trigger:
1)date 觸發器
date 是最基本的一種調度,作業任務只會執行一次。它表示特定的時間點觸發。它的參數如下:
參數 說明
run_date (datetime 或 str) 作業的運行日期或時間
timezone (datetime.tzinfo 或 str) 指定時區
date 觸發器使用示例如下:
from datetime import datetime
from datetime import date
from apscheduler.schedulers.background import BackgroundScheduler
def job_func(text):
print(text)
scheduler = BackgroundScheduler()
# 在 2017-12-13 時刻運行一次 job_func 方法
scheduler .add_job(job_func, 'date', run_date=date(2017, 12, 13), args=['text'])
# 在 2017-12-13 14:00:00 時刻運行一次 job_func 方法
scheduler .add_job(job_func, 'date', run_date=datetime(2017, 12, 13, 14, 0, 0), args=['text'])
# 在 2017-12-13 14:00:01 時刻運行一次 job_func 方法
scheduler .add_job(job_func, 'date', run_date='2017-12-13 14:00:01', args=['text'])
scheduler.start()
2)interval 觸發器
固定時間間隔觸發。interval 間隔調度,參數如下:
參數 說明
weeks (int) 間隔幾周
days (int) 間隔幾天
hours (int) 間隔幾小時
minutes (int) 間隔幾分鐘
seconds (int) 間隔多少秒
start_date (datetime 或 str) 開始日期
end_date (datetime 或 str) 結束日期
timezone (datetime.tzinfo 或str) 時區
interval 觸發器使用示例如下:
import datetime
from apscheduler.schedulers.background import BackgroundScheduler
def job_func(text):
print(datetime.datetime.utcnow().strftime("%Y-%m-%d %H:%M:%S.%f")[:-3])
scheduler = BackgroundScheduler()
# 每隔兩分鐘執行一次 job_func 方法
scheduler .add_job(job_func, 'interval', minutes=2)
# 在 2017-12-13 14:00:01 ~ 2017-12-13 14:00:10 之間, 每隔兩分鐘執行一次 job_func 方法
scheduler .add_job(job_func, 'interval', minutes=2, start_date='2017-12-13 14:00:01' , end_date='2017-12-13 14:00:10')
scheduler.start()
3)cron 觸發器
在特定時間週期性地觸發,和Linux crontab格式兼容。它是功能最強大的觸發器。
我們先了解 cron 參數:
參數 說明
year (int 或 str) 年,4位數字
month (int 或 str) 月 (範圍1-12)
day (int 或 str) 日 (範圍1-31
week (int 或 str) 周 (範圍1-53)
day_of_week (int 或 str) 周內第幾天或者星期幾 (範圍0-6 或者 mon,tue,wed,thu,fri,sat,sun)
hour (int 或 str) 時 (範圍0-23)
minute (int 或 str) 分 (範圍0-59)
second (int 或 str) 秒 (範圍0-59)
start_date (datetime 或 str) 最早開始日期(包含)
end_date (datetime 或 str) 最晚結束時間(包含)
timezone (datetime.tzinfo 或str) 指定時區
這些參數是支持算數表達式,取值格式有如下:
cron 觸發器使用示例如下:
import datetime
from apscheduler.schedulers.background import BackgroundScheduler
def job_func(text):
print("當前時間:", datetime.datetime.utcnow().strftime("%Y-%m-%d %H:%M:%S.%f")[:-3])
scheduler = BackgroundScheduler()
# 在每年 1-3、7-9 月份中的每個星期一、二中的 00:00, 01:00, 02:00 和 03:00 執行 job_func 任務
scheduler .add_job(job_func, 'cron', month='1-3,7-9',day='0, tue', hour='0-3')
scheduler.start()
4.3 作業存儲(job store)
該組件是對調度任務的管理。
1)添加 job
有兩種添加方法,其中一種上述代碼用到的 add_job(), 另一種則是scheduled_job()修飾器來修飾函數。
這個兩種辦法的區別是:第一種方法返回一個 apscheduler.job.Job 的實例,可以用來改變或者移除 job。第二種方法只適用於應用運行期間不會改變的 job。
第二種添加任務方式的例子:
import datetime
from apscheduler.schedulers.background import BackgroundScheduler
@scheduler.scheduled_job(job_func, 'interval', minutes=2)
def job_func(text):
print(datetime.datetime.utcnow().strftime("%Y-%m-%d %H:%M:%S.%f")[:-3])
scheduler = BackgroundScheduler()
scheduler.start()
2)移除 job
移除 job 也有兩種方法:remove_job() 和 job.remove()。
remove_job() 是根據 job 的 id 來移除,所以要在 job 創建的時候指定一個 id。
job.remove() 則是對 job 執行 remove 方法即可
scheduler.add_job(job_func, 'interval', minutes=2, id='job_one')
scheduler.remove_job(job_one)
job = add_job(job_func, 'interval', minutes=2, id='job_one')
job.remvoe()
3)獲取 job 列表
通過 scheduler.get_jobs() 方法能夠獲取當前調度器中的所有 job 的列表
修改 job
如果你因計劃改變要對 job 進行修改,可以使用Job.modify() 或者 modify_job()方法來修改 job 的屬性。但是值得注意的是,job 的 id 是無法被修改的。
scheduler.add_job(job_func, 'interval', minutes=2, id='job_one')
scheduler.start()
# 將觸發時間間隔修改成 5分鐘
scheduler.modify_job('job_one', minutes=5)
job = scheduler.add_job(job_func, 'interval', minutes=2)
# 將觸發時間間隔修改成 5分鐘
job.modify(minutes=5)
5)關閉 job
默認情況下調度器會等待所有正在運行的作業完成後,關閉所有的調度器和作業存儲。如果你不想等待,可以將 wait 選項設置爲 False。
scheduler.shutdown()
scheduler.shutdown(wait=false)
4.4 執行器(executor)
執行器顧名思義是執行調度任務的模塊。最常用的 executor 有兩種:ProcessPoolExecutor 和 ThreadPoolExecutor
下面是顯式設置 job store(使用mongo存儲)和 executor 的代碼的示例。
from pymongo import MongoClient
from apscheduler.schedulers.blocking import BlockingScheduler
from apscheduler.jobstores.mongodb import MongoDBJobStore
from apscheduler.jobstores.memory import MemoryJobStore
from apscheduler.executors.pool import ThreadPoolExecutor, ProcessPoolExecutor
def my_job():
print 'hello world'
host = '127.0.0.1'
port = 27017
client = MongoClient(host, port)
jobstores = {
'mongo': MongoDBJobStore(collection='job', database='test', client=client),
'default': MemoryJobStore()
}
executors = {
'default': ThreadPoolExecutor(10),
'processpool': ProcessPoolExecutor(3)
}
job_defaults = {
'coalesce': False,
'max_instances': 3
}
scheduler = BlockingScheduler(jobstores=jobstores, executors=executors, job_defaults=job_defaults)
scheduler.add_job(my_job, 'interval', seconds=5)
try:
scheduler.start()
except SystemExit:
client.close()