視頻轉文字-視頻語義分析

原創

大鹏要高飞

2020-07-05 14:16

Project ：視頻轉文本
Introduction：通過使用FFmpeg-Python庫,將視頻的音頻抽取出來存放至本地文件夾，再調用
百度語音識別REST Api，將音頻轉化文字，該Api可識別英語和普通話
Attention ：上傳的視頻不能超過60s.同時需要主機聯網纔可調用雲Api
Quickstart :
1.Download Anaconda and Install it
https://www.anaconda.com/distribution/
2.Open the Terminal,and input this command:
conda env create -f bat_video.yaml
3. python main.py

import os
import ffmpeg
from aip import AipSpeech


# 百度語音識別REST-Api 
APP_ID = '176xxxx'
API_KEY = 'xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx'
SECRET_KEY = 'xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx'
client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

# 輸入視頻路徑
video_path = os.path.abspath('./Raw_Video')
text_path =  os.path.abspath('./Output_Text')
radio_path = os.path.abspath('./Raw_Radio')
files= os.listdir(video_path)


# 主函數
def main():
	for file in files: 
		filename = os.path.splitext(str(file))[0]
		# ffmpeg視頻抽取音頻
		in_stream = ffmpeg.input(video_path+'/'+str(file))
		(in_stream   
		    .output(radio_path+'/'+filename+'.pcm',format='s16le', acodec='pcm_s16le', ac=1, ar='16k')
		    .run()
		)
		# 識別本地文件
		test=client.asr(get_file_content(radio_path+'/'+filename+'.pcm'), 'pcm', 16000, {
		    'dev_pid': 1537,
		})
        # 內容寫入文本並保存
		txt_name = text_path+'/'+filename+'.txt'
		f = open(txt_name, 'w')
		f.write(str(test['result']))
		f.close()


# 讀取文件
def get_file_content(filePath):
    with open(filePath, 'rb') as fp:
        return fp.read()


if __name__=='__main__':
	main()

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

FFmpeg保存rtsp流爲m3u8文件

目錄問題解決方法一、分割ts法方法二、m3u8保存法問題目前遇到一個需求，希望把rtsp的線上視頻流保存爲m3u8文件，並保存到指定目錄。解決方法一、分割ts法最開始想到的方法是先將rtsp視頻流保存爲ts文件

2024-05-14 00:37:38

程序員不存在了……嗎？

近期，在談及人工智能的發展速度時，馬斯克預計，按照當前的技術進步速度，到2030年人工智能的智力可能超越人類，這項技術甚至有可能終結人類。那麼，人工智能的強大究竟對人類將帶來更多機遇還是危機呢？今天，我們特邀了《深入理解 FFmpeg

2024-05-08 11:12:06

推薦一個電視直播源檢測工具--live-streaming-m3u8-checker，檢測結果可以真正流暢播放

使用教程首先搜索直播源，存放到playlists文件夾下，支持txt和m3u播放列表；併到 https://ffmpeg.org/download.html#build-windows 這裏下載 ffmpeg.exe文件，放到當前

2024-04-21 00:46:42

Qt/C++音視頻開發70-無感切換通道/無縫切換播放視頻/多通道流暢切換/不同視頻打開無縫切換

一、前言之前就寫過這個方案，當時做的是ffmpeg內核版本，由於ffmpeg內核解析都是代碼實現，所以無縫切換非常完美，看不到絲毫的中間切換過程，看起來就像是在一個通道畫面中。其實這種切換隻能說是取巧辦法，最佳的辦法應該是公用一個open

2024-04-18 10:40:53

Qt/C++音視頻開發69-保存監控pcm音頻數據到mp4文件/監控錄像/錄像存儲和回放/264/265/aac/pcm等

一、前言用ffmpeg做音視頻保存到mp4文件，都會遇到一個問題，尤其是在視頻監控行業，就是監控攝像頭設置的音頻是PCM/G711A/G711U，解碼後對應的格式是pcm_s16be/pcm_alaw/pcm_mulaw，將這個原始的音頻

2024-03-12 11:14:11

對話阿里云何亞明：多媒體的未來，正迎面未知的高速列車

抓住已知的，迎面未知的。編者按：大模型、降本、出海，是多媒體從業者交流的高頻詞，內容與交互的需求層出不窮，大模型與AI的演進目不暇接，讓增速低走的視頻雲迎面新的機遇和挑戰。作爲一個跨越中美多媒體行業20年的親歷者（阿里雲視頻雲負責人何亞

2024-03-04 23:48:45

儀表板對接海康威視攝像頭實現實時監控方案

前言在數據分析中，常常會有設計管理駕駛艙，或者指揮中心等綜合性數據可視化大屏，在這種大屏設置中經常會有對接攝像頭的需求，希望能夠直接展示攝像頭查看實時監控，或者點擊大屏看板可以跳轉彈出實時監控，今天小編就爲大家介紹一下如何使用葡萄城公司的

2024-03-04 22:53:26

centos7安裝ffmpeg mp3轉成amr格式

因爲企業微信客服只支持amr格式的音頻需要做個轉化

2023-10-25 21:25:28

RecordRTC錄製的視頻對比以及h26四轉爲mpeg-4

使用RecordRTC官網的Demo，錄製同樣爲30s的視頻，相同的運動畫面，採用不同編碼方式，每個視頻錄製兩遍，對比視頻體積。使用RecordRTC錄製視頻時支持的格式： vp8，vp9，mkv，h26四，使用whammy編碼通過

2023-08-19 02:15:14

Android 使用NDK R21編譯ffmpeg

一、前言編譯ffmpeg是學習ffmpeg的第一步，本篇博客的環境是mac os 上 NDK21 版本編譯ffmpeg。之所以寫這篇博客，主要是因爲去年編譯的時候一切順利進行，而今年電腦CPU燒了（使用電腦設備要特別小心電量問題，電量太

2023-06-26 23:53:55

雲剪輯-B端在線剪輯⼯具架構設計與演進

騰訊雲音視頻的雲剪輯致力於讓客戶在自己的應用（Web、小程序）中快速集成剪輯能力，同時強大的模板能力能夠極大地提升視頻生產效率。我們在探索B端在線剪輯產品的過程中遇到不少挑戰：如何滿足快速與定製兩種集成場景？如何設計通用、高性能、可靈活拓展

2023-05-10 23:48:30

Ffmpeg分佈式視頻轉碼問題總結

本文主要聊一聊雲原生時代分佈式轉碼系統實施過程中碰到的一些問題。聊問題之前簡單介紹一下我們的分佈式轉碼方案。雲原生分佈式轉碼在計算資源招之即來的雲計算時代，正在重構着軟件架構的方方面面。對軟件架構師或者運維管理者影響比較大的一個點

2023-04-22 21:25:05

Java 自動擴容Mmap數據寫入性能測試

背景：低配設備I/O優化，利用mmap實現日誌的管理。測試代碼： public class MmapWriter { private static final int BUF_SIZE = 4096; p

2023-04-10 23:54:09

urls

golang執行命令 && 實時獲取輸出結果如何使用Golang進行視頻轉換 Golang調用FFmpeg轉換視頻流 golang binding for ffmpeg FFMPEG wrapper written in GO FFmpe

2023-04-05 11:51:11

Qt音視頻開發14-音視頻文件保存基類的設計

一、前言視頻綜合應用示例，包括了多種內核，在保存文件這個功能上，需要一個通用的文件保存基類AbstractSaveThread，這個基類定義了是否打印線程消息標誌位、直接寫入還是排隊寫入標誌位、文件生成後是否調用轉換合併標誌位、是否執行了

2023-02-19 11:02:08

24小時熱門文章

最新文章

最新評論文章