音頻格式詳解

經典的WAV、WAVE文件作爲最經典的Windows多媒體音頻格式,應用非常廣泛,它使用三個參數來表示聲音:採樣位數、採樣頻率和聲道數。
聲道有單聲道和立體聲之分,採樣頻率一般有11025Hz(11kHz)、22050Hz(22kHz)和44100Hz(44kHz)三種。WAVE文件所佔容量=(採樣頻率×採樣位數×聲道)×時間/8(1字節=8bit)。
傳統的MOD
MOD是一種類似波表的音樂格式,但它的結構卻類似 MIDI,使用真實採樣,體積很小,在以前的DOS年代,MOD經常被作爲遊戲的背景音樂。現在的MOD可以包含很多音軌,而且格式衆多,如S3M、NST、669、MTM、XM、IT、XT和RT等。

電腦音樂MIDI
MIDI是Musical Instrument Data Interface的簡稱,它採用數字方式對樂器所奏出來的聲音進行記錄(每個音符記錄爲一個數字),然後,播放時再對這些記錄通過FM或波表合成:FM合成是通過多個頻率的聲音混合來模擬樂器的聲音;波表合成是將樂器的聲音樣本存儲在聲卡波形表中,播放時從波形表中取出產生聲音。

龍頭老大MP3
MP3可謂是大名鼎鼎,它採用MPEG Audio Layer 3 技術,將聲音用 1∶10 甚至 1∶12 的壓縮率壓縮,採樣率爲44kHz、比特率爲112kbit/s。
MP3音樂是以數字方式儲存的音樂,如果要播放,就必須有相應的數字解碼播放系統,一般通過專門的軟件進行MP3數字音樂的解碼,再還原成波形聲音信號播放輸出,這種軟件就稱爲MP3播放器,如Winamp等。

網上霸主RA系列
RA、RAM和RM都是Real公司成熟的網絡音頻格式,採用了“音頻流”技術,所以非常適合網絡廣播。在製作時可以加入版權、演唱者、製作者、Mail 和歌曲的Title等信息。
RA可以稱爲互聯網上多媒體傳播的霸主,適合於網絡上進行實時播放,是目前在線收聽網絡音樂最好的一種格式。

高壓縮比的VQF
VQF即TwinVQ是由Nippon Telegraph and Telephone同YAMAHA公司開發的一種音頻壓縮技術。
VQF的音頻壓縮率比標準的MPEG音頻壓縮率高出近一倍,可以達到1∶18左右甚至更高。而像MP3、RA這些廣爲流行的壓縮格式一般只有1∶12左右。但仍然不會影響音質,當VQF以44kHz-80kbit/s的音頻採樣率壓縮音樂時,它的音質會優於44kHz-128kbit/s的MP3,以44kHz-96kbit/s壓縮時,音樂接近44kHz-256kbit/s的MP3。

迷你光盤MD
MD(即MiniDisc)是SONY公司於1992年推出的一種完整的便攜音樂格式,它所採用的壓縮算法就是ATRAC技術(壓縮比是1∶5)。MD又分爲可錄型MD(Recordable,有磁頭和激光頭兩個頭)和單放型MD(Pre-recorded,只有激光頭)。
強大的編輯功能是MD的強項,可以快速選曲、曲目移動、合併、分割、刪除和曲名編輯等多項功能,比CD更具個性化,隨時可以擁有一張屬於自己的MD專輯。MD的產品包括MD隨身聽、MD牀頭音響、MD汽車音響、MD錄音卡座、MD攝像槍和MD驅動器等。

音樂CD
即CD唱片,一張CD可以播放74分鐘左右的聲音文件,Windows系統中自帶了一個CD播放機,另外多數聲卡所附帶的軟件都提供了CD播放功能,甚至有一些光驅脫離電腦,只要接通電源就可以作爲一個獨立的CD播放機使用。

潛力無限的WMA
微軟在開發自己的網絡多媒體服務平臺上主推ASF(Audio Steaming format),這是一個開放支持在各種各樣的網絡和協議上的數據傳輸的標準。它支持音頻、視頻以及其他一系列的多媒體類型。而WMA是Windows Media Audio的縮寫,相當於只包含音頻的ASF文件。
WMA文件在80kbps、44kHz的模式下壓縮比可達1∶18,基本上和VQF相同。而且壓縮速度比MP3提高一倍。所以它應該比VQF更具有競爭力。

免費音樂格式Vorbis
爲了防止MP3音樂公司收取的專利費用上升,GMGI的iCast公司的程序員開發了一種新的免費音樂格式Vorbis,其音質可以與MP3相媲美,甚至優於MP3。並且將通過網絡發佈,可以免費自由下載,不必擔心會涉及侵權問題。但MP3在網上已經非常流行,微軟的Windows Media技術也開始普及,Vorbis的前景還是不容樂觀。

DVD-Audio
   DVD-Audio是以DVD(Digital Versatile Disc)作爲儲存媒介的新音樂媒體,於1999年三月提出。取樣方式爲LPCM(Linear Pulse Code Modulation),可選擇性採用MLP(Meridian Lossless Packing)無失真壓縮技術減少龐大的資料容量。DVD-Audio的取樣率有44.1kHz、48kHz、88.2kHz、96kHz、176.4kHz、192kHz等,可以16Bits、20Bits、24Bits取樣,使用立體聲錄製時最大資料流量可達192kHz 24Bits,當採用5.1聲道(家庭劇院用中置一顆揚聲器、主聲道兩顆、後環繞兩顆、超低音一顆合稱5.1聲道)錄製時最大取樣率可達96kHz。DVD-Audio可於播放時搭配畫面與音樂輸出。DVD-Audio如此高的取樣率最大的好處在於不需要繁複的超取樣運算就可以得到正確的音訊波型,另一個好處是減少jitter對音質的影響。

其它音頻格式
AIF/AIFF:蘋果公司開發的一種聲音文件格式,支持MAC平臺,支持16位44.1kHz立體聲。
AU:SUN的AU壓縮聲音文件格式,只支持8位的聲音,,是互連網上常用到的聲音文件格式,多由SUN工作站創建。
CDA:CD音軌文件。
CMF:CREATIVE 公司開發的一種類似MIDI的聲音文件。
DSP:Digital Signal Processing(數字信號處理)的簡稱。通過提高信號處理方法,音質會極大地改善,歌曲會更悅耳動聽。
S3U:MP3播放文件列表
RMI:MIDI樂器序列

有損壓縮:
AAC:在高比特率下音質僅次於MPC,在高比特率和低比特率下表象都很不錯。就是編碼速度太慢!
MPC:低比特率下表現一般,不及Mp3Pro編碼的MP3和OGG,高比特率下音質最好,編碼速度快!
OGG:低比特率下音質最好,高比特率同樣也不錯。編碼速度稍慢。
MP3(MP3Pro):在低比特率下音質次於OGG,其他方面同MP3
WMA:高低比特率下都一般,不支持VBR,最高192Kbit/s

無損壓縮:
FLAC:壓縮率在四個中最差,編碼速度不錯,平臺支持很好。
PAC:稍慢的編碼速度,壓縮率排第三,平臺支持良好。
APE:編碼速度最快、最好的壓縮率,平臺支持一般。
WV:編碼速度非常快,壓縮率在四個種排第二,僅支持Windows平臺

十款音頻格式比較

       一、WMA

  由於是微軟的作品,絕對不能小看,WMA象一劑強心針一樣促進了流式媒體格式的大進步。WMA文件可以在僅僅20K Bitrate的流量下提供可聽的音質,因此WMA常常當作用於在線收聽和廣播的首選,微軟早就在Windows Media Player中提供了播放支持。當WMA的Bitrate上升到128k時,幾乎在同級別的所有有損編碼格式中笑傲江湖了,MP3在128KBitrate時,會出現明顯的高頻丟失,而WMA不會。但似乎128k是WMA一個檻,當Bitrate再往上提升時,不會有太多的音質改變。MP3卻不一樣,在192K時,音質可以比WMA好了。微軟推出WMA編碼時主要有2個針對目標,一個是瞄準了網絡上的RM和RAM格式,另一個是用戶硬盤中的MP3。但在高音質要求下,WMA仍無法構成對MP3的威脅。如果你要獲得12:1左右或更高的壓縮比,就不妨選擇WMA格式,在這個流量下,WMA優秀太多了。
  WMA和MP3的優劣一直是大家爭論的焦點,其實這是一個無法回答的問題。這要看你的實際需要,是追求高音質(mp3)還是高壓縮率(wma)。

  二、VQF

  在WMA未流行之前,VQF是很受歡迎的一種格式,因爲在低比特率下它的音質要好於MP3(比WMA稍差)。不支持"流"是VQF的致命弱點,這可能也是爲什麼現在它完全被WMA壓下去的一個主要原因。

  三、MP3

  MP3最受爭議的就是音質問題(尤其是隨着WMA的普及),其高頻損失很大,很多MP3編碼器粗糙的編碼算法不但導致高頻丟失,還丟失了許多細節,類似吉他擦弦的感覺在MP3中是找不到的。在對MP3快要失望時,偶發現了Lame,它支持根據人耳遮蔽效應原理來分析波形,配合VBR技術,可以讓音質達到令人吃驚的地步;其獨創的心理音響模型技術保證了CD音頻還原的真實性,配合VBR(動態比特率)和ABR(平均比特率)參數,編碼出來的MP3音色純厚、空間寬廣、低音清晰、細節表現良好,音質幾乎可以媲美CD音頻,但文件體積卻非常小。很多網友在使用LAME後的反映就是:立刻刪除硬盤上所有的MP3和其他編碼器,全部用Lame重新過一遍。
  Lame提供EXE和DLL,其中DLL是作爲標準的動態運行庫供其他程序調用。EXE是Command Line程序,象DOS程序一樣工作,兩者彼此獨立,互不關聯。但大家很快能發現兩者編碼的質量是不一樣的,那是由於dll可控性差,與具備豐富調節參數的EXE版相比,其壓縮出來的MP3效果稍遜一籌。但EXE是一個命令行工具,操作很麻煩,幸虧有了WinLAMEr或lameGUIxp這些Shell。只要學會使用這些Shell(是傻瓜型的,一看即會),就可以用LAME壓縮出最最精彩的MP3了。
  再說說APS,在LAME出現以前,APS就是最好的MP3編碼器,它使用的Fraunhofer IIS編碼算法,這比LAME使用的編碼算法要先進,在192k Bitrate(CBR)下,甚至比LAME編碼的曲子要優秀,細節明顯要豐富一些,但APS本身不支持VBR,當Bitrate往上提高時,音質就要比LAME編碼的要差了,大部分朋友的MP3的一般都是128-192K Bitrate的,因此APS仍舊有推薦的價值。特別是有很多MP3隨身聽不支持VBR和256K Bitrate以上的MP3,LAME就不一定合適這些朋友了,APS就成了不錯的選擇,由它編碼的曲子,絕對不會辱沒你昂貴的PLAYER。

  四、MP3PRO

  MP3PRO完全是基於傳統MP3編碼技術的一種改良,本身最大的技術亮點就在於SBR(Spectral Band Replication頻段複製),這是一種新的音頻編碼增強算法。它提供了改善低位率情況下音頻和語音編碼的性能的可能。這種方法可在指定的位率下增加音頻的帶寬或改善編碼效率,SBR最大的優勢就是在低數據速率下實現非常高效的編碼。如果在高數據速率的情況下,SBR將如同虛設。當製作MP3PRO文件時,編碼器將音頻分爲兩部分。一部分是將音頻數據中的低頻段部分分離出來,通過傳統的MP3技術而編碼得出的正常的MP3音頻流,此舉可令到MP3編碼器可以專注於低頻段信號從而獲得更好的壓縮質量,而且原來的MP3播放器也可播放MP3PRO文件。另一部分則是將分離出來的高頻段信號進行編碼並嵌入到MP3流中,傳統的MP3播放器會將其忽略掉,而新的MP3PRO播放器則可從中還原出高頻信號,並將兩者進行組合,得到高質量的全帶寬的聲音。官方宣稱通過這樣的技術,使得MP3PRO能在64kbps的編碼率便可提供與128kbps的mp3相同的質量。
  低比特率下MP3PRO的性能很明顯地比MP3要高,但是它與WMA誰勝誰負就很難說了,根據一些發燒友的評測, MP3PRO似乎略勝一些。高比特率下很少有人用到MP3PRO。

  五、OGG

  在高音質要求下,有損音頻編碼世界中是三足項立,分別爲MP3、MPC、OGG。在大量新技術的支持下,這些編碼都有非常出色的表現,都各自擁有一羣支持者。較高比特率下,OGG展現出來的素質是很令人稱道的,但是OGG也有一個不小的缺點,就是高頻的金屬味道,這多少有點讓人失望。

  六、MPC

  較高比特率下(250kbps左右),MPC表現非常的出衆,甚至超過了MP3,很難分辨它和原始信號有多少區別,無論從頻率保留還是細節保留,以及信號強度失真來說,MPC太優秀了。但MPC並非萬能的,它無法編碼48khz採樣率的曲子,所幸的是,這樣的曲子來源很少。可惜這種格式並沒有像MP3或WMA那樣流行。

  七、ATRAC

  MD採用的就是ATRAC(Adaptive TRansform Acoustic Coding自適應聲學轉換編碼)壓縮算法,ATRAC目前僅支持MD,ATRAC還有一種衍生算法ATRAC3,OpenMG Jukebox使用的就是這種編碼,編碼後的文件擴展名爲OMG。它集編碼、抓軌、播放、管理和輸出於一身,個頭比較龐大,但操作還算方便。它使用了人耳遮蔽原理,能夠有效的過濾人耳不敏感的聲音信號,以達到更高的壓縮比。與ATRAC不同的是,ATRAC3支持不同的平均數據速率,有132、105、66Kbits可選。這個軟件可以直接向某些支持MDLP的MD機型提供直接輸出,這樣可以節省很多錄製時間。這個軟件對文件進行了嚴格的版權保護,無法象Mp3那樣進行自由拷貝和備份。如果你有支持MDLP的MD,不妨試一試這個軟件。

  八、APE

  和上面介紹的幾款編碼不同的是,這個編碼提供了最好的音質保證(無損壓縮)!還提供了Winamp的插件支持,可以直接用Winamp來播放。所謂無損就是指壓縮後的格式和源文件在音質上並無差異,而Mp3、WMA等的編碼方案是基於有損的,在損失部分音質的前提下節約存貯空間,所以說音質再好的Mp3、WMA也只能是無限接近源文件的音質。APE非常適合來編碼講究細節的獨奏曲目和大動態的交響曲。向各位音樂迷們(不是歌迷)作最強烈的推薦!
  它的壓縮比約爲2:1。

  九、WAV

  它是未經壓縮的格式,似乎不用多說,在APE未流行時,WAV一直是音質完美主義者的首選,即使是現在,如果你想做出高質量的音樂,WAV也是無法替代的中間體(因爲目前公認最精確的抓軌軟件EAC從CD直接得到的音樂是WAV格式)。

  十、RM

  RM已經是昨日黃花,沒有任何新意,低Bitrate比不過WMA,高Bitrate比不過MP3,雖然新的RM導入了ATRAC3算法,但頹勢已定,很難東山再起了。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章