第三章 音訊媒體
1.聲音的基本原理
(1)介質震動,造成壓力,而此壓力會以波的形式藉由介質向外擴散,傳到人的耳朵且頻率範圍在人耳可感應的範圍內(通常是20Hz~20kHz),耳膜會因感應而聽見聲音
(2)在真空中是聽不見聲音的
(3)聲音在物理中用來表示音量的單位為分貝(dB)
(4)對一般的多媒體音訊工作者來說,類比與數位的轉換、取樣頻率、量化、修剪、解析度、壓縮原理、檔案格式、音訊播放…等內容較為重要
2.類比與數位的轉換
(1)類比轉換為數位
(2)數位轉換為類比
3.取樣頻率
(1)聲音數位化最重要的就是將類比訊號取樣
(2)取樣頻率越高,亦即取樣間隔時間越短,所擷取後的數位音訊資料就越準
4.量化-位元深度(解析度)
(1)取樣在每一個上升邊緣時,ADC 會將當時的值紀錄下來,而此紀錄的值稱為樣本,單位為bit(或稱為解析度),此動作即為量化。
(2)位元深度造成的誤差,造成了數位還原為類比時的不連續,雜訊就是這樣產生的
(3)越高的位元深度,或稱為解析度,會有越真實的音質,但無論我們採用多高的位元深
度來取樣,也不可能完全無誤差的記錄下輸入的類比訊號,這就是「量化失真」
度來取樣,也不可能完全無誤差的記錄下輸入的類比訊號,這就是「量化失真」
5.修剪
量化過程中的位元深度不足,輸入的類比訊號最大值超過此位元深度可使用的區間時,就會將振幅超出最大值的部分修剪為可用區間的最大值,而被修剪掉的部份就成為了失真或是雜音,因此輸入的聲音過大時,錄製起來的聲音會「爆音」即是此原因。
6.音訊壓縮原理
(1)常見的音訊壓縮有MP3、WMA等,MP3的全名為MPEG Audio Layer 3,而WMA則為
Windows Media Audio;DVD 所使用的壓縮技術則為LPCM (Linear Pulse Code Modulation)、DolbyDigital、DTS等
Windows Media Audio;DVD 所使用的壓縮技術則為LPCM (Linear Pulse Code Modulation)、DolbyDigital、DTS等
(2)以上常見的壓縮技術除了LPCM 之外,均為「破壞性壓縮」(但LPCM 檔案相當大)
(3)一般常用的MP3 為128kbps (16kBytes),其壓縮後的容量僅為原始的十分之一不到,但聲音卻好的令一般人難以察覺,其主要技術為「最小聽覺門檻」與「遮蔽效應」
#最小聽覺門檻:是一種用來減少資料流的方法。人耳對於2kHz~ 5kHz 的敏銳度與察覺度最高,所以它利用人耳的這項特性,將其他頻率的紀錄容量減少,甚至將微小不易察覺的高頻與低頻訊號刪除,以達到資料容量減少的目的
#遮蔽效應:是一種運用人類聽覺神經特性的技術。在心理學中這是一種聽覺模型,它是說當一個感覺非常強烈時,同時間人類不太容易覺察到其他的感覺。遮蔽效應就是利用刪除,或是分配較低的取樣頻率給這些被別的較突出的聲音遮蔽後變的較不易被察覺的聲音,來減少其容量大小
7.多聲道音訊
廣泛應用於DVD Movie 中的多聲道音訊編碼格式為Dolby Digital (AC3) 與Digital Theater Systems(DTS)。這兩種格式均為破壞性壓縮的6聲道系統,包含中央、前左、前右、後左、後右與重低音
8.常見音訊檔案格式
(1)WAV
(a)由微軟制定,採PCM 編碼的未壓縮波形格式,主要用於Windows PC 中,符合RIFF Resource Interchange FileFormat 規範
(b)所有的WAV 都有檔案標頭,其記載著此檔案的編碼參數
(c)WAV 並無對取樣的硬性規定值,可以在錄音時自行設定
(d)WAV 也可以像AVI 那樣使用不同的CODE 來壓縮,不過一般人對於WAV 的定義都是使用PCM 編碼,但其實AVI 一樣是可以用別的CODE 來編碼的,甚至是MP3
(2)AU
(a)AU 是UNIX 下一種常用的格式,為昇陽(SUN) 所開發,其副檔名為.au
(b)AU 本身也支援多種壓縮模式,但本身的架構不如AIFF和WAV。此格式現在已經鮮少人知了,目前大概只有在使用到JAVA 的時候才會使用到AU 格式
(3)AIFF
(a)AIFF 是Apple 的標準格式,其副檔名為.aiff。平時我們熟知的QuickTime就是使用AIFF 作為音訊的軟體
(a)AIFF 是Apple 的標準格式,其副檔名為.aiff。平時我們熟知的QuickTime就是使用AIFF 作為音訊的軟體
(b)AIFF 本身是一種功能很強的格式,其支援了許多的壓縮技術,但是它為MacOS 專用的格式,因此在PC上較為少見。但Apple 在多媒體播放工具上的佔有率也不容小覷,正因為如此,AIFF 格式到現在還是有其固定的使用者
(4)MP3
(A)MP3 (MPEG Audio Layer 3) 屬於MPEG 標準的一環,其副檔名為.mp3
(b)其高效率的資料壓縮與音質效果,再加上便利的播放程式以及編碼程式支援,使得MP3的使用者越來越多,目前絕對是多媒體音訊的標準
(c)它可以藉由調整位元傳輸速率來調整其壓縮大小,範圍從16kbps~320kbps 都有,而在一般的標準128kbps下,可使得一分鐘的MP3 檔案壓縮成不到1MB,而且播放的效果幾乎聽不出與原來的差異
(5)WMA
(a)WMA 就是Windows Media Audio,由微軟開發,其副檔名為.wma
(b)最大特色就是比MP3 容量還要小一半,且音質不輸MP3 的特色。WMA 有著無失真、有失真、語音,全方面的需求支援
(c)它在網路上的串流品質較佳,再加上WMA 的編碼與播放都是相當方便,直接在微軟的網站與WindowsXP/Vista 都有內建
(6)Real Audio
(a)普遍應用於網際網路上的聲音格式,必須安裝Real Player 播放程式,才能播放此聲音檔
(b)早期網路頻寬低的時候Real Audio 確實成功的創造了網路音訊串流的新紀元,但隨著網路頻寬的增加,以及WMA 的出現,Real Audio 的音質與位元率的令人失望,儘管新的Real Audio 有在做補強,但仍是慢了一步
(a)普遍應用於網際網路上的聲音格式,必須安裝Real Player 播放程式,才能播放此聲音檔
(b)早期網路頻寬低的時候Real Audio 確實成功的創造了網路音訊串流的新紀元,但隨著網路頻寬的增加,以及WMA 的出現,Real Audio 的音質與位元率的令人失望,儘管新的Real Audio 有在做補強,但仍是慢了一步
(c)不過Real Networks 在網路上打下的金字招牌可是相當硬的,到現在仍然是網路串流的主流之一
參考資料:http://www.cyut.edu.tw/~jjliaw/pages/98_02_course/multimedia/Ch02.pdf
沒有留言:
張貼留言