1
目 標 場 景
相信大家平時刷抖音短視頻的時候,看到顏值高的小姐姐,都有隨手點贊關注的習慣。
如果一條條去刷確實很耗時間,如果 Python 能幫忙篩選出顏值高的小姐姐那就省了很多事。
本篇文章是藉助「百度人臉識別」API,幫我們識別出抖音上顏值高的小姐姐,然後下載到手機相冊中。
2
準 備 工 作
首先,項目需要對頁面元素進行一些精準的操作,需要提前準備一部 Android 設備,激活開發者選項,並在開發者選項中打開 「USB 調試和指針位置」兩處設置。
爲了確保 adb 命令能正常使用,需要提前配置好 adb 開發環境。
頁面元素中的部分元素沒法利用 name 等常用屬性獲取到,可能需要獲取到完整的「UI 樹」,再利用 Airtest 判斷是否存在某個 UI 元素。
# 安裝依賴
另外,項目中會對視頻進行人臉識別,獲取到出現的所有人臉,再進行性別識別及顏值判斷。
這裏需要進行百度雲後臺,註冊一個人臉識別的應用,獲取到一組 「API Key 和 Secret Key」值。
然後利用官網提供的 API 文檔即可獲取到「access token」,由於 ak 的有效期爲一個月,所以只需要初始化一次,後面就可以利用人臉識別接口進行正常的識別了。
appid = '你註冊應用的appid'api_key = '你註冊應用的ak'secret_key = '你註冊應用的sk'def get_access_token(): """ 其關access_token有效期一般有一個月 """ # 此變量賦值成自己API Key的值 client_id = api_key # 此變量賦值成自己Secret Key的值 client_secret = secret_key auth_url = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=' + client_id + '&client_secret=' + client_secret header_dict = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Trident/7.0; rv:11.0) like Gecko', "Content-Type": "application/json"} # 請求獲取到token的接口 response_at = requests.get(auth_url, headers=header_dict) json_result = json.loads(response_at.text) access_token = json_result['access_token'] return access_token
3
編 寫 腳 本
在上面已經配置好了 adb 環境的情況下,可以直接藉助 python 中的 os 模塊執行 adb 命令打開抖音 App。
# 抖音App的應用包名和初始Activitypackage_name = 'com.ss.android.ugc.aweme'activity_name = 'com.ss.android.ugc.aweme.splash.SplashActivity'
接着,我們需要截取當前播放視頻的截圖到本地。
需要注意的是,抖音視頻播放界面包含視頻創作者頭像、BGM 創作者頭像等一些雜亂的元素,可能對人臉識別的結果產生一些誤差,所以需要對屏幕截圖之後的圖像進行「二次裁剪」處理。
def get_screen_shot_part_img(image_name): """ 獲取手機截圖的部分內容 :return: """ # 截圖 os.system("adb shell /system/bin/screencap -p /sdcard/screenshot.jpg") os.system("adb pull /sdcard/screenshot.jpg %s" % image_name) # 打開圖片 img = Image.open(image_name).convert('RGB') # 圖片的原寬、高(1080*2160) w, h = img.size # 截取部分,去掉其頭像、其他內容雜亂元素 img = img.crop((0, 0, 900, 1500)) img.thumbnail((int(w / 1.5), int(h / 1.5))) # 保存到本地 img.save(image_name) return image_name
現在可以使用百度提供的 API 獲取到上面截圖的人臉列表。
def parse_face_pic(pic_url, pic_type, access_token): """ 人臉識別 5秒之內 :param pic_url: :param pic_type: :param access_token: :return: """ url_fi = 'https://aip.baidubce.com/rest/2.0/face/v3/detect?access_token=' + access_token # 調用identify_faces,獲取人臉列表 json_faces = identify_faces(pic_url, pic_type, url_fi) if not json_faces: print('未識別到人臉') return None else: # 返回所有的人臉 return json_faces
從上述的人臉列表中篩選出性別爲女,年齡爲 18-30 歲之間,顏值超過 70 的小姐姐。
def analysis_face(face_list): """ 分析人臉,判斷顏值是否達標 18-30之間,女,顏值大於80 :param face_list:識別的臉的列表 :return: """ # 是否能找到高顏值的美女 find_belle = False if face_list: print('一共識別到%d張人臉,下面開始識別是否有美女~' % len(face_list)) for face in face_list: # 判斷是男、女 if face['gender']['type'] == 'female': age = face['age'] beauty = face['beauty'] if 18 <= age <= 30 and beauty >= 70: print('顏值爲:%d,及格,滿足條件!' % beauty) find_belle = True break else: print('顏值爲:%d,不及格,繼續~' % beauty) continue else: print('性別爲男,繼續~') continue else: print('圖片中沒有發現人臉.') return find_belle
由於視頻是連續播放的,很難通過截取視頻某一幀,判斷視頻有出現顏值高的小姐姐。
另外,大部分短視頻播放時長爲「10s+」,這裏需要對每一個視頻多次截圖去做人臉識別,直到識別到顏值高的小姐姐。
# 一條視頻最長的識別時間
一旦當前播放的視頻識別出有顏值高的小姐姐,就需要模擬保存視頻到本地的操作。
獲取「分享」和「保存本地」兩個按鈕的座標位置,依次利用 adb 執行點擊操作即可下載視頻到本地。
def save_video_met(): """ :return: """ # 分享 os.system("adb shell input tap 1000 1500") time.sleep(0.05) # 保存到本地 os.system("adb shell input tap 350 1700")
另外,由於下載視頻的過程是一個耗時操作,在下載進度對話框還未消失之前,需要做一個「模擬等待」的操作。
def wait_for_download_finished(poco): """ 從點擊下載,到下載完全 :return: """ element = Element() while True: # 由於是對話框,不能利用Element類來判斷是否存在某個元素來準確處理 # element_result = element.findElementByName('正在保存到本地') # 當前頁面UI樹元素信息 # 注意:保存的時候可能會獲取元素異常,這裏需要拋出,並終止循環 # com.netease.open.libpoco.sdk.exceptions.NodeHasBeenRemovedException: Node was no longer alive when query attribute "visible". Please re-select. try: ui_tree_content = json.dumps(poco.agent.hierarchy.dump(), indent=4).encode('utf-8').decode('unicode_escape') except Exception as e: print(e) print('異常,按下載處理~') break if '正在保存到本地' in ui_tree_content: print('還在下載中~') time.sleep(0.5) continue else: print('下載完成~') break
在視頻保存到本地之後,就可以模擬向上滑動的操作,跳到播放「下一條視頻」。
循環上面的操作,即可篩選出所有顏值高的小姐姐,並保存到本地。
def play_next_video(): """ 下一個視頻 從下往上滑動 :return: """ os.system("adb shell input swipe 540 1300 540 500 100")
在腳本一條條刷視頻的過程中,可能會遇到一下廣告,我們需要對這類視頻進行過濾。
def is_a_ad(): """ 判斷的當前頁面上是否是一條廣告 :return: """ element = Element() ad_tips = ['去玩一下', '去體驗', '立即下載'] find_result = False for ad_tip in ad_tips: try: element_result = element.findElementByName(ad_tip) # 是一條廣告,直接跳出 find_result = True break except Exception as e: find_result = False return find_result
4
結 果 結 論
運行上面的腳本,會自動打開抖音,對每一條小視頻多次進行人臉識別,直到識別到顏值高的小姐姐,保存視頻到本地,然後繼續刷下一條短視頻。
大家在學python的時候肯定會遇到很多難題,以及對於新技術的追求,這裏推薦一下我們的Python學習扣qun:784758214,這裏是python學習者聚集地!!同時,自己是一名高級python開發工程師,從基礎的python腳本到web開發、爬蟲、django、數據挖掘等,零基礎到項目實戰的資料都有整理。送給每一位python的小夥伴!每日分享一些學習的方法和需要注意的小細節