音高追蹤的基本流程如下:
1、將整段音訊訊號切成音框(frames),相鄰音框之間可以重疊。
2、算出每個音框所對應的音高。
3、排除不穩定的音高值。(可由音量來帥選,或由音高值的範圍來過濾。)
4、對整段音高進行平滑化,通常是使用“中位數濾波器”(median filters)。
由一個音框計算出音高的方法很多,可以分爲時域和頻域兩大類。
````時域(time domain):
*ACF:Autocorrelation function
*AMDF:Average magnitude difference function
*SIFT:Simple inverse filter tracking
````頻域(frequency domain):
*Harmonic product spectrum method
*Cepstrum method
一、ACF(使用自相關函數進行音高追蹤)
二、AMDF
三、SIFT
連接見:http://neural.cs.nthu.edu.tw/jang/books/audioSignalProcessing/ptTimeDomainSift.asp?title=7-4 SIFT
四、HPS
連接見:http://neural.cs.nthu.edu.tw/jang/books/audioSignalProcessing/ptFreqDomainHps.asp?title=7-5 HPS
五、Cepstrum
連接見:http://neural.cs.nthu.edu.tw/jang/books/audioSignalProcessing/ptFreqDomainHps.asp?title=7-5 HPS
六、音高解析度的提升
連接見:http://neural.cs.nthu.edu.tw/jang/books/audioSignalProcessing/ptResolution.asp?title=7-7 How to Increase Pitch Resolution (音高解析度的提升)
源地址:http://bingxinye1.blog.163.com/blog/static/1687970982011820281924/