轉載：Python調用麥克風錄音生成wav文件

原創

2019-03-14 23:37

**事出有因：**我想調用科大訊飛的語音聽寫SDK包，但是這個包對輸入音頻有一定的要求，格式工廠畢竟不是個辦法——網上找來找去，有用信息也是零零散散，所幸還是有所收穫——請將以下代碼寫入get_audio.py文件中。
特別說明在代碼後，看了還是有用的
特別說明在代碼後，看了還是有用的

# -*- coding：utf-8 -*-
# -*- author：zzZ_CMing  CSDN address:https://blog.csdn.net/zzZ_CMing
# -*- 2018/07/12; 15:19
# -*- python3.5
import pyaudio
import wave
input_filename = "input.wav"               # 麥克風採集的語音輸入
input_filepath = "音頻存儲位置"              # 輸入文件的path
in_path = input_filepath + input_filename

def get_audio(filepath):
    aa = str(input("是否開始錄音？   （是/否）"))
    if aa == str("是") :
        CHUNK = 256
        FORMAT = pyaudio.paInt16
        CHANNELS = 1                # 聲道數
        RATE = 11025                # 採樣率
        RECORD_SECONDS = 5
        WAVE_OUTPUT_FILENAME = filepath
        p = pyaudio.PyAudio()

        stream = p.open(format=FORMAT,
                        channels=CHANNELS,
                        rate=RATE,
                        input=True,
                        frames_per_buffer=CHUNK)

        print("*"*10, "開始錄音：請在5秒內輸入語音")
        frames = []
        for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):
            data = stream.read(CHUNK)
            frames.append(data)
        print("*"*10, "錄音結束\n")

        stream.stop_stream()
        stream.close()
        p.terminate()

        wf = wave.open(WAVE_OUTPUT_FILENAME, 'wb')
        wf.setnchannels(CHANNELS)
        wf.setsampwidth(p.get_sample_size(FORMAT))
        wf.setframerate(RATE)
        wf.writeframes(b''.join(frames))
        wf.close()
    elif aa == str("否"):
        exit()
    else:
        print("無效輸入，請重新選擇")
        get_audio(in_path)

# 聯合上一篇博客代碼使用，就註釋掉下面，單獨使用就不註釋
get_audio(in_path)

特別說明：
一、這是一個可循環採樣的腳本，介於輸出文件名都是input.wav，所以在你保存音頻的path下永遠只生成一個音頻文件(後一個會覆蓋前一個)，你可以自己改成不循環的——但是循環的腳本用處更大，比如說做人機對話不能說一句就掛了吧，哈哈哈

二、調用的時候，也要先在你的python主程序開始處導入這個.py文件。怎麼導入！！！上一篇也說了你沒學會？—— 就像你導入其他外置包一樣——from get_audio import get_audio；

三、你可以結合我上一篇博客Python調用科大訊飛語音聽寫的SDK包，把這兩個代碼聯合使用，怎麼聯合使用：

    註釋掉本篇博客最後一行；
    將兩篇博客中的錄音文件地址(本篇path是in_path，上一篇path是filepath)指向同一個目錄下的同一個文件，兩個的作用分別是：本篇博客代碼用來採集音頻，將音頻存入path中，上篇博客代碼通過path調用該音頻，轉爲文本輸出；
    主函數大致代碼如下：

# 採集音頻
get_audio(in_path)
sys.stdout.write("you ask>> ")

# 科大語音聽寫：語音轉文本輸出   請參考上一篇博客
input_seqs = keda_API.XF_text(in_path, audio_rate)

---------------------
作者：zzZ_CMing
來源：CSDN
原文：https://blog.csdn.net/zzZ_CMing/article/details/81739193
版權聲明：本文爲博主原創文章，轉載請附上博文鏈接！

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

轉載：Python調用麥克風錄音生成wav文件

snap佔用佔用100%

yolov3-tiny　訓練。以及yolov3 畫圖。

保存結果，改爲ｘｍｌ，修改ＸＭＬ

轉載：算力計算

Mat 　iplimage

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結