揭開 DSD 的神秘面紗:數位音訊編碼之爭 DSD vs. PCM

转自:http://www.techbang.com/posts/22079-unlocking-the-mystery-of-dsd-the-dsd-digital-audio-coding-vs-pcm?page=1

引言

先前我們介紹了不同數位音訊的儲存格式,裡面有些微提到一些脈衝編碼調變(Pulse-code modulation,PCM)的基礎概念,但除了PCM或更精準地說是線性脈衝編碼調變(Linear pulse-code modulation,LPCM)之外,近期還有一個非常受關注的DSD(Direct Stream Digital)編碼格式。現在市面上的高階播放器,大多打著能支援DSD解碼來當作一個賣點,但是到底甚麼是DSD編碼格式?是否真的有如同廠商宣稱提供更優良的音質?這就是本篇文章所要和大家一起探討的,底下就讓筆者來簡單的介紹一下DSD歷史。

揭開 DSD 的神秘面紗:數位音訊編碼之爭 DSD vs. PCM_第1张图片

Direct Stream Digital的歷史

事實上DSD的起源已經非常久,早在60年代就已經有利用脈衝密度調變〈Pulse-density modulation,PDM〉編碼,將音頻訊號記錄在數位媒體上,正確來說應該是由PDM一個特殊分支 -脈衝寬度調變(Pulse Width Modulation,PWM)來實現,這種編碼方式目前已經完全被PDM格式所取代。

目前常見的DSD編碼就是基於PDM規範,這個音樂編碼格式的標準規範在1999年發表,是由當時領導音樂儲存格式的巨頭Sony和Philips合作開發,至於為何制定DSD規範的原因有些複雜。主要是因為那時候由Sony和Philips所制定的CD 〈Compact Disc〉規範專利快要過期,在即將失去由CD專利帶來的大量收益情況下,Sony和Philips決定再次聯手打造下一代的音樂儲存規格Super Audio Compact Disc 〈SACD〉,所以DSD的出現絕大部分是因為商業考量。

在儲存編碼上,SACD使用和CD常見PCM編碼完全不同的音訊格式,採用單位元的DSD編碼。Sony花下重金聘請當時最頂尖的兩位聲音工程師Ed Meitner〈現任職於EMM Labs〉和Andreas Koch 〈現任職於Playback Design〉來制定SACD規範,並且在初期免費開放給大多數知名錄音室使用,這成為DSD音訊儲存格式第一次大規模被使用在商業活動上。

超級音頻光碟〈SACD〉的起源

講到DSD自然必須介紹一下SACD,SACD取樣頻率高達2822.4kHz,是一般CD取樣頻率44.1kHz的64倍,而且理論上具有能夠再生100kHz以上頻率範圍的能力。此外由於SACD使用DSD的脈衝編碼,因此省去位元轉換的過程,同時降低數位濾波可能產生失真和雜訊的問題。

雖然這一切都讓SACD聽起來非常的美好,但SACD在推廣的路途上卻是相當艱難,因為當Sony和Philips決定用專利屏障再次壟斷音訊儲存格式時,其他音樂製作公司和硬體生產商卻看上了正蓬勃發展的DVD光碟,並且希望利用這個容量更大的儲存媒介來發行高品質音樂光碟,就此開啟了新世代音樂儲存媒介規格的戰火。

Super Audio CD和傳統CD音樂光碟規格比較

揭開 DSD 的神秘面紗:數位音訊編碼之爭 DSD vs. PCM_第2张图片

高品質音樂儲存規格之爭

DVD-Audio規格很迅速地在SACD出現的隔一年後正式上路,使用和CD相同的LPCM編碼,並且可以儲存高達192kHz/24bit雙聲道的高品質音樂。DVD-Audio在音樂製作上和傳統的CD音樂並沒有太大區別,由於多數音樂製作公司都歷經過CD格式的洗禮,因此剛開始大部分音樂製作公司,偏向選擇技術上更加成熟的DVD-Audio規格,當然也有一部分理由是可以擺脫Sony和Philips的專利束縛。

想當然,Sony和Philips為了捍衛自家格式和利益自然會做出反擊,Sony和Philips藉由自己在硬體製造上的優勢,拉攏大多數DVD播放器製造商,讓後續生產的DVD播放器無法相容DVD-Audio。這個作法嚴重的打擊DVD-Audio陣營,雖然DVD-Audio陣營有不少大型公司支持,但是其內部意見卻是相當分歧。由於每個成員都怕被另一個規範所束縛,這為DVD-Audio推廣之路種下了失敗的種子。

另外更令內部成員驚恐的是,在那音樂盜版猖獗的年代,DVD加密法很快地就被駭客所破解,每個音樂製作公司都害怕DVD-Audio會重演CD的盜版局面,因而都裹足不前。第一份正式DVD-Audio音樂光碟,居然是由一個發燒友,在缺乏良好錄音設備的小型研究室錄製。

在DVD-Audio陣營內部互相猜忌的情況下,Sony乘勝追擊的許諾SACD將永遠不能被電腦所播放,這幾個舉動成功穩固住SACD作為新一代音樂光碟的地位,並且也解決了雙方陣營長久以來懼怕盜版的疑慮。

揭開 DSD 的神秘面紗:數位音訊編碼之爭 DSD vs. PCM_第3张图片

▲SACD標誌及SACD的種類。由左至右分別為 〈1〉單層SACD〈4.7 GB〉 〈2〉雙層SACD〈8.5 GB〉 〈3〉混和型SACD〈4.7 GB〉 〈圖片來源:網路資源〉。

SACD的殞落

經過上面一大串折騰和較勁之後,Sony和Philips陣營開始自信滿滿地宣傳和推廣多聲道格式SACD,並且宣稱未來是高品質多聲道音樂的年代,而且也漸漸獲得多數音樂製作公司的認同。眼看著儲存格式大戰就要分出勝負的時候,Apple的iPod迅雷不及掩耳上市了,爾後幾年將線上數位音樂下載量,更提升到了一個驚人的程度。

面對Apple所掀起的線上數位音樂潮流,Sony選擇繼續維持SACD的生產和發行,並且在2003年規劃出同時擁有傳統CD層和SACD層的混和型SACD,期望在實體音樂光碟銷售上有所突破。但是這很快地就碰上SACD播放器銷售不佳的問題,因為當年的SACD播放器價格大多落在5,000元美金以上〈約新台幣15萬〉,非常少消費者願意購買昂貴,而且只能播放音樂的SACD播放器,因此讓SACD的銷售受到直接的影響。

再加上幾年後,Wavelength Audio發布了基於電腦播放的非同步USB DAC,這使得利用電腦播放高品質音訊檔案變得更加容易。爾後又隨著全世界網路速度的提升,和線上音樂的流行,出門購買音樂光碟漸漸的不再是獲得高品質音樂唯一來源,SACD就此成為只有少部分音樂愛好者的選擇。

揭開 DSD 的神秘面紗:數位音訊編碼之爭 DSD vs. PCM_第4张图片

▲混和型SACD結構圖和讀取機制,混和型SACD具有一層4.7GB容量的DSD層〈上層〉,同時還包含一個符合PCM紅皮書的CD音樂層〈下層〉,這使得它能夠相容於傳統的CD播放器。〈圖片來源:Wikipedia〉

2006年,在體認到SACD幾乎已經不可能成功的情況下,Sony做了一個策略上的大轉變,推翻之前SACD將不會被電腦播放的承諾。Sony推出以SACD為基礎的DSD-Disc,這個格式的SACD將舊有物理防拷貝保護層移除,使得電腦也能夠讀取這類型光碟片。

但是由於已經失去市佔率,DSD-Disc在完全沒有推出過任何商業音樂光碟下就被拋棄,從2009年後就已經沒有大型商業音樂製作商,使用SACD當做音樂儲存媒介。雖然到這邊,由Sony和Philips主導的SACD已經完全潰敗,但也為後續的DSD格式音樂打開了另一扇大門。

DSD音樂播放原理

上面看完了DSD音樂格式的歷史資訊,這邊筆者想先來介紹一下DSD到底和PCM有甚麼不同,首先我們就從介紹DSD音訊編碼開始。DSD編碼DSD則使用不同於以往PCM邏輯來記錄音訊,DSD訊號是以ΔΣ調變後的PDM編碼形式儲存在儲存媒介上,DSD的內部記錄的是一個連續時間的單一位元序列,以固定的時間間隔來記錄,在標準的SACD規格下每個取樣間隔是1/2822400秒,取樣頻率為CD規格 〈44.1kHz〉 的64倍之高。

DSD每一次取樣會比對本次取樣和上一個樣本值的變動,接下來使用0和1來記錄振幅的變化,0代表比上一個訊號值來得低,1代表比上一個訊號值來格高,所以每一個取樣的訊號是和前一個訊號的相對值。DSD藉由非常高的取樣頻率,將以往量化不精準所造成的失真,下降到一個位元以內的誤差。

揭開 DSD 的神秘面紗:數位音訊編碼之爭 DSD vs. PCM_第5张图片

▲DSD音訊PDM編碼示意圖,DSD在每1/2822400秒記錄下一個單位元的資料,每一次記錄的資料是和前一個資料的相對值。〈圖片來源:Wikipedia〉

為了確保每一位讀者,都能夠輕易理解等一下的DSD和PCM比較,在這邊快速地介紹一下PCM編碼。PCM編碼主要包含取樣〈Sampling〉、量化〈Quantization〉、編碼〈Coding〉三個過程,如下圖上半部所示,PCM也是在一個固定的間隔時間內〈如CD是1/44100秒〉記錄下原始類比訊號的振幅。

但和DSD不同的是,PCM記錄的是一個絕對值而非DSD的相對值,每一個不同的振幅強弱都有其代表的數值。然後再將記錄下來的數值轉換成離散時間訊號,最後再依據PCM規範給予一個編碼就是常見的LPCM格式數位音訊。簡單來說,PCM編碼就是在連續的時間〈X軸〉座標下,記錄當時的振幅〈Y軸〉大小。

揭開 DSD 的神秘面紗:數位音訊編碼之爭 DSD vs. PCM_第6张图片

▲Linear-PCM編碼示意圖,在固定時間間隔下〈圖中為1/44100秒〉,記錄當下的振幅大小的絕對值。〈圖片來源:Wikipedia〉

DSD音樂播放

DSD音樂的記錄和播放流程,相較於傳統PCM編碼來得簡化許多,由於目前市面上主流是使用基於單位元的類比數位轉換器(analog-to-digital converter,ADC),來進行音樂錄製。所以如果將錄下來的聲音直接使用DSD格式儲存的話,在播放時只需要在輸出端,經過一個開關電容網路構成的低通濾波器,來還原成類比訊號即可。

整個流程相較於傳統的PCM處理,省去了在錄音端單位元轉多位元的過程,和在播放端必須經由超取樣和ΔΣ調變成PDM訊號的手續。這使得DSD具有非常好的先天優勢,並且理論上能夠在硬體端節省下多餘的處理元件,也間接地降低處理過程所產生的失真。

SACD較早時期採用1bit轉換技術造成的高頻抖動〈dithering〉與諧波〈Idle Tone〉等問題,目前的DAC晶片為了因應1bit解碼缺點,大多使用多位元〈例如:6 bit,64階〉的ΔΣ調變。此種調變混合1bit PDM和PCM的優點,在低電位輸出時直接調整輸出脈衝電壓為低電壓,可以讓後續的低通濾波電路設計問題簡化不少。在理論上看起來是如此的完美,但是人算不如天算,完美的事情永遠只在理想狀態下發生,筆者將在後面的章節和各位討論DSD所需要面對的問題和優勢。

揭開 DSD 的神秘面紗:數位音訊編碼之爭 DSD vs. PCM_第7张图片

▲〈上圖〉PCM音訊的錄製和播放流程簡圖,總共歷經兩次超取樣處裡和兩次位元數轉換,〈下圖〉理想狀態下DSD音樂錄製和播放流程簡圖,過程中無須經過超取樣和位元數轉換。

DSD和PCM編碼比較

由上面的介紹就可以看出,DSD和PCM是兩種完全不同思維模式的編碼,而兩種規格也擁有各自的優點和缺點,底下筆者將非常淺顯的介紹DSD編碼相對於PCM編碼的優缺點。

DSD編碼優勢

理論上極高的取樣頻寬:

標準的DSD音樂使用2.8224MHz取樣頻率,理論上能夠記錄最高到1411.2kHz〈取樣頻率的一半〉的聲音,相較於傳統CD使用的44.1kHz取樣頻率,這讓DSD格式擁有非常寬廣的取樣頻寬,即便和目前錄音室常見的高規格24bit/192kHz PCM錄音相比〈取樣頻寬最高達96kHz〉,DSD也擁有超過14倍之多的取樣頻寬。

優良的動態範圍〈0~20kHz〉:

DSD訊號經由高頻雜訊整形〈noise shaping〉電路處理,將DSD帶有的高頻雜訊,提升到超越人耳聆聽範圍外的頻率後,在0~20kHz的頻率範圍內,DSD擁有理論數據上高達150db的動態範圍 〈如下圖〉,相較於16 bits/24 bits PCM編碼的96db/144db動態範圍,DSD編碼理論上擁有更好的動態範圍〈0~20kHz〉。



▲DSD和PCM編碼比較,紅色框格內代表24/96kHz PCM編碼可記錄的範圍,橘色為24/192kHz,綠色為24/384kHz可記錄範圍,24bit的PCM訊號底噪坐落在記錄範圍之外,理論上小於-144db;藍色線為2.8224MHz DSD在不同頻率範圍的底噪示意圖,可以發現在大約30kHz後,DSD編碼的底噪急遽上升,在接近極限頻率時達到大約-6db的響度。〈圖片來源:Playback Designs〉

更小的音樂容量:

DSD編碼在儲存容量上也具有一定的優勢,隨著音質的提高,PCM音樂的檔案大小可以說是指數型成長。而DSD由於編碼上的優勢,在標準的2.8224MHz取樣頻率下,DSD的檔案容量只約略超過24/96kHz的PCM音樂一些。這使得DSD不論是在儲存或是網路下載,都比PCM格式來得有優勢。

揭開 DSD 的神秘面紗:數位音訊編碼之爭 DSD vs. PCM_第8张图片

除了上列的優勢之外,DSD音樂在播放時還具有無取樣頻率限制、直接支援DAC主要時鐘和長傳輸距離的優點。

DSD編碼缺點

上面提完DSD的主要優勢,但就跟多數的規範一樣,DSD也有其無法克服的技術缺點。而且這些實際操作上的缺點,反倒嚴重的抵銷DSD上述的優勢,並且在大多數情況下還產生更多的問題,底下就讓筆者來介紹一下DSD編碼相較於PCM編碼有甚麼樣的缺點。

實際上較窄的頻率範圍:

標準的DSD編碼有一個先天的缺點,相較於CD規格的16bit/44.1kHz的-96db〈16*6db〉底噪來說,DSD的底噪高達-6db,這個現象在實際測量上也可以觀察到〈見圖X〉。DSD編碼在超過20kHz的時候,會產非常大量的高頻雜訊,如果不將這些雜訊移除,將會對後端的音響器材造成傷害。所以必定需要經過濾波技術的處理,現在的處理方式是利用雜訊整形電路,將雜訊移到人耳聆聽範圍外〈>20kHz〉。

但這也說明後續就要由低通濾波器將這些雜訊移除,由Sony的規範書來看,DSD訊號必須經由一個截斷點為50kHz的低通濾波電路處理移除高頻雜訊。這使得現實上在播放時能使用的最大頻率範圍,大約只比30kHz高一點點,這直接影響到DSD其中一個優勢:「理論上極高的取樣頻寬」。為了減少高頻雜訊的問題,目前最新的DSD檔案都使用雙倍的取樣頻率〈DSD128〉,理論上藉由雜訊整形電路,能夠將高頻雜訊推到更高的頻率範圍,但實際上還是無法解決通過低通電路後實際能用的頻率範圍。

檔案經過多次格式轉換:

由於DSD編碼是一種單位元的記錄格式,使得DSD音訊幾乎完全無法利用現在的音訊設備來編輯,因此在音樂後製的時候,DSD音訊還是必須被轉換成PCM音訊來編輯。目前的DSD音樂編輯模式,是先將DSD轉換成Digital eXtreme Definition〈DXD〉格式,DXD本質上就是352.8kHz / 24bit的PCM編碼音訊,等後製和音樂編輯完畢後,再轉換為DSD訊號。因此DSD音樂檔案反倒同時繼承DSD和PCM的缺點,並且在多次的轉換過程中,還會額外導入另一層的高頻雜訊,這使得DSD原本希望移除PCM編碼缺陷的初衷,完全不存在現在的DSD音樂中。

相對高解析PCM編碼沒有顯著優勢:

DSD編碼當初的比較目標大多是CD規格的PCM音訊,但在高解析度的PCM音訊流行的當下,高解析度PCM音訊實際可用的取樣範圍和雜訊控制能力,完全優於標準的DSD格式〈見圖X〉。為了解決這個問題,剛剛提到雙倍取樣的DSD128音訊就此誕生,雖然可以些微的降低DSD雜訊過高的問題,但單位元編碼先天上的缺陷依然存在,並且雙倍取樣的DSD128音樂檔案大小,對比高解析PCM音訊來說,也變得沒有儲存容量上的優勢。

硬體支援度不廣泛:

DSD處理對於目前已經習慣PCM音樂已久的音樂製作公司來說,必須投入額外的成本才能進行後製,所以嚴重的影響到DSD格式的推廣。此外目前市面上絕大多數支援DSD播放的DAC,是將DSD音訊重新編碼回PCM訊號的方式來播放,只有非常少部分的DAC支援原生播放DSD音樂。除此之外,DSD傳輸並沒有被大多數傳輸規範所納入,像是USB Audio 2.0和Mac平台的特性規範中,音訊傳輸就只有標準PCM一種格式。

好在最近被推廣DSD-over-PCM〈DoP〉傳輸規範解決這部分的問題,這個傳輸規範使用24bit/ 176.4kHz PCM傳輸來包裝DSD訊號,利用前面8個位元來當做DSD的標記。又由於2.8224MHz取樣的DSD音訊資料量相當於16bit/176.4kHz的PCM音訊資料量,所以後面的16位元就可以用來包裝DSD音訊,讓有能力的硬體廠商自行研發DSD解決方案,並且也讓不支援DSD傳輸的iOS系統有機會播放DSD音樂。當然這樣的傳輸規範也有它的缺點,那就是由於資料是藉由PCM訊號的方式包裝,如果當硬體誤判DSD為PCM訊號時,就會在88kHz的地方產生一個大約-34db的雜音,並且播放DSD的相關操作和設定過程相當繁雜,所以DSD音樂規格還是相對地不普及。

揭開 DSD 的神秘面紗:數位音訊編碼之爭 DSD vs. PCM_第9张图片

小結

相信看完以上的介紹文章,各位讀者對於DSD這個編碼格式都有了一定程度的了解,也許有人會問說:既然DSD有那麼多不便和缺點,為什麼最近突然有一群廠商在推廣DSD音樂格式?

筆者必須在這邊說,沒有一個格式是沒有缺點,端看實際使用和市場的反應。不過關於DSD規格會在最近被推廣的原因,筆者推測和DSD規範出現到現在已經超過十年有關,大部分的技術類專利有效期限是十年左右,所以基本上DSD格式現在已經成為一個開放式規格。再來目前主力的推廣DSD的公司,是當初開發DSD規格的Andreas Koch所任職的Playback Design,自然會希望能夠將DSD音樂推廣開來。

反倒是製造業界用於轉換DSD與PCM標準規格的瑞士數位音樂公司Weiss的老闆Daniel Weiss,在兩年前發表了一份簡短的DSD白皮書,很明白的點出DSD無法後製處理,一定要先轉換為PCM訊號,才能進行必要的後製工作。所以在錄音階段,Weiss推薦還是先用PCM格式儲存聲音訊號比較實際。

再順道回過頭看一下當初制定DSD規範的Sony,目前和日本音響協會一同制定新的「Hi-Res」認證,仔細閱讀其內部規範後,可以發現雖然DSD同樣被視為高解析音源,但是在高解析音源的定義中,並沒有對DSD格式做特別著墨,可以推敲出Sony對這個已經失去專利主導權的音訊格式的態度。

但總體而言,DSD和PCM誰好誰壞並不是真正的重點,它們都只是儲存音樂的一種格式,重要的還是裡面所包含的音樂。因為音樂的感動並不是靠音樂儲存格式來決定,一個儲存格是只要還有足夠的人在繼續使用,就有它被保留的意義存在。至於DSD和PCM到底誰會成為未來格式的霸主?就讓音樂製作公司來煩惱吧。

你可能感兴趣的:(pdm,PCM,dsd)