**事出有因:**我想調用科大訊飛的語音聽寫SDK包,但是這個包對輸入音頻有一定的要求,格式工廠畢竟不是個辦法——網上找來找去,有用信息也是零零散散,所幸還是有所收穫——請將以下代碼寫入get_audio.py文件中。
特別說明在代碼後,看了還是有用的
特別說明在代碼後,看了還是有用的
# -*- coding:utf-8 -*-
# -*- author:zzZ_CMing CSDN address:https://blog.csdn.net/zzZ_CMing
# -*- 2018/07/12; 15:19
# -*- python3.5
import pyaudio
import wave
input_filename = "input.wav" # 麥克風採集的語音輸入
input_filepath = "音頻存儲位置" # 輸入文件的path
in_path = input_filepath + input_filename
def get_audio(filepath):
aa = str(input("是否開始錄音? (是/否)"))
if aa == str("是") :
CHUNK = 256
FORMAT = pyaudio.paInt16
CHANNELS = 1 # 聲道數
RATE = 11025 # 採樣率
RECORD_SECONDS = 5
WAVE_OUTPUT_FILENAME = filepath
p = pyaudio.PyAudio()
stream = p.open(format=FORMAT,
channels=CHANNELS,
rate=RATE,
input=True,
frames_per_buffer=CHUNK)
print("*"*10, "開始錄音:請在5秒內輸入語音")
frames = []
for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):
data = stream.read(CHUNK)
frames.append(data)
print("*"*10, "錄音結束\n")
stream.stop_stream()
stream.close()
p.terminate()
wf = wave.open(WAVE_OUTPUT_FILENAME, 'wb')
wf.setnchannels(CHANNELS)
wf.setsampwidth(p.get_sample_size(FORMAT))
wf.setframerate(RATE)
wf.writeframes(b''.join(frames))
wf.close()
elif aa == str("否"):
exit()
else:
print("無效輸入,請重新選擇")
get_audio(in_path)
# 聯合上一篇博客代碼使用,就註釋掉下面,單獨使用就不註釋
get_audio(in_path)
特別說明:
一、這是一個可循環採樣的腳本,介於輸出文件名都是input.wav,所以在你保存音頻的path下永遠只生成一個音頻文件(後一個會覆蓋前一個),你可以自己改成不循環的——但是循環的腳本用處更大,比如說做人機對話不能說一句就掛了吧,哈哈哈
二、調用的時候,也要先在你的python主程序開始處導入這個.py文件。怎麼導入!!!上一篇也說了你沒學會?—— 就像你導入其他外置包一樣——from get_audio import get_audio;
三、你可以結合我上一篇博客Python調用科大訊飛語音聽寫的SDK包,把這兩個代碼聯合使用,怎麼聯合使用:
註釋掉本篇博客最後一行;
將兩篇博客中的錄音文件地址(本篇path是in_path,上一篇path是filepath)指向同一個目錄下的同一個文件,兩個的作用分別是:本篇博客代碼用來採集音頻,將音頻存入path中,上篇博客代碼通過path調用該音頻,轉爲文本輸出;
主函數大致代碼如下:
# 採集音頻
get_audio(in_path)
sys.stdout.write("you ask>> ")
# 科大語音聽寫:語音轉文本輸出 請參考上一篇博客
input_seqs = keda_API.XF_text(in_path, audio_rate)
---------------------
作者:zzZ_CMing
來源:CSDN
原文:https://blog.csdn.net/zzZ_CMing/article/details/81739193
版權聲明:本文爲博主原創文章,轉載請附上博文鏈接!