對于數(shù)字流音樂玩家而言,「DSD」絕對是近期最吸引目光的焦點;因為,近來有越來越多USB或無線網(wǎng)絡DAC打著「能解DSD」的旗號,而且其中不乏參考售價僅新臺幣三萬元左右(或更低)的「平價機種」(以Hi-End音響而言),這股風潮甚至延伸到家庭劇院領域,Pioneer去年九月底發(fā)布的旗艦環(huán)繞放大器SC-LX86之USB輸入就可對應2.8224MHz/1bit的DSD數(shù)字音樂文件播放。
由于先前DSD數(shù)字音樂文件播放功能,最早只出現(xiàn)于極高價位的數(shù)字模擬轉(zhuǎn)換器(例如最早推出DSD數(shù)字訊源器材的emm Labs(相關閱讀:《EMM Labs:DSD/SACD數(shù)字技術先驅(qū)》),2010年年初正式推出的dCS Debussy與去年上市、參考售價超過新臺幣五百萬元的新旗艦dCS Vivaldi系統(tǒng)(相關閱讀:《dCS、Antelope新品亮相2012香港高級視聽展》),以及2011年Playback Designs所推出的MPS-3等3系列產(chǎn)品),因此近期推出的中低價位數(shù)字流DAC都「不約而同」將DSD解碼對應作為強力賣點,一時之間彷彿DSD解碼才是王道、DSD數(shù)字音樂文件播放肯定優(yōu)于多位元方式,事實果真是如此嗎?抑或只是商業(yè)行銷手法?這就是本文要探討的重點。
DSD是Direct Stream Digital的縮寫,是Sony與Philips推出SACD時運用于其上的脈沖密度調(diào)變(pulse-density modulation)編碼技術,通過單位元(0或1)序列以音樂CD 44.1kHz的64倍的頻率(即2.8224MHz)取樣,意圖將過往多位元量化不精確的噪音及失真誤差降低到一個位元以內(nèi)。(相關閱讀:《KORG MR-1 微型數(shù)碼錄音機測評與DSD播放器前瞻》)
其實,DSD與多位元PCM之間的爭戰(zhàn)并非近日才發(fā)生,早在二十多年前1991年SACD與DVD-Audio音樂光碟推出時就已開打,只不過由于Sony與Philips封鎖SACD唱盤的原碼數(shù)字輸出,直到近一、兩年才有2L等唱片公司推出DSD數(shù)字音樂下載,再加上DSD數(shù)字音樂文件通過電腦播放的「先天缺陷」,讓DSD數(shù)字音樂文件之數(shù)字流播放,比起多位元音樂文件晚了數(shù)年才全面啟動,因此兩者之爭才在近期浮上臺面。支持DSD數(shù)字流播放的玩家看到這里,肯定會大喊:「什么?DSD在電腦播放有“先天缺陷”?」先不要激動,請看看dCS公司對DSD音樂文件通過USB播放的說明(請見這里),或者臺灣知名專業(yè)音樂制作公司「MidiMall米地摩爾」官網(wǎng)的中文剖析內(nèi)容,就可以清楚理解。
簡單地說,包括USB介面在內(nèi)的個人電腦可說是多位元PCM的「領地」,USB Audio 2.0的聲音定義只有PCM,蘋果電腦的Max OS X的USB驅(qū)動程式及中央聲音處理引擎CoreAudio也只支持PCM,于是DSD數(shù)字音樂文件要通過個人電腦播放,就必須通過「偽裝」方式封裝在24bit/176.4kHz的PCM串流里,通過USB傳輸稱為DoP(DSD over PCM)、通過乙太網(wǎng)絡則為DoPE(DSD over PCM Ethernet),其做法是將DSD的音樂資料擺放于24個位元里較低的16個位元,前面的8個位元則紀錄是DSD或PCM串流的標記,如此一來數(shù)字模擬轉(zhuǎn)換器辨識之后,只要能對應24bit/176.4kHz的PCM解碼,就可對「隱身其中」的標準64fs DSD(64倍于CD取樣率)音樂文件解碼播放,至于兩倍資訊量的128fs DSD數(shù)字音樂文件,則只要數(shù)字模擬轉(zhuǎn)換器解碼能力在24bit/352.8kHz以上就可對應。
這是「MidiMall米地摩爾」官網(wǎng)對于DSD音樂信號如何嵌入封裝在PCM多聲道串流里的說明圖,目前無論經(jīng)由USB或乙太網(wǎng)絡介面播放DSD數(shù)字音樂文件,都需要通過如此的手法。
說到這里,各位應該已能理解為何最近中低價數(shù)字模擬轉(zhuǎn)換器產(chǎn)品,支持DSD解碼者如雨后春筍般接連冒出來了吧?那是由于先前DoP或DoPE只有具備自行撰寫數(shù)字解碼程式能力的高階廠商(例如前述的dCS、Playback Designs及emm Labs等)才有辦法提供,直到去年一些內(nèi)建DoP對應的192kHz/24bit DAC芯片出現(xiàn)后,中低價位DAC方能以簡便廉宜的代價,支持DSD數(shù)字音樂文件通過USB或乙太網(wǎng)絡傳輸,也因此造就了「DSD高解析音樂檔及解碼播放,可帶來至高傳真音樂重播」的印象。然而,真的是如此嗎?
按一下計算機,64fs DSD取樣率是64倍于音樂CD 16bit/44.1kHz的2.8224MHz,因此資料量相當于多位元PCM的16bit/176.4kHz。換句話說,純粹以記錄資訊相比,單位元DSD的2.8224MHz與多位元PCM的16bit/176.4kHz是相當?shù)?,那我們是否可認定比16bit/176.4kHz更高的多位元PCM音樂文件(例如16bit/176.4kHz、24bit/192kHz甚至24bit/352.8kHz),就一定比64fs DSD更優(yōu)呢?
當然不行!這就好比數(shù)字相機更高的成像解析度,并不等同于更高畫質(zhì)的保證一樣,在畫面構成畫素的多寡之外,還有色域?qū)挾?、色彩純度、對比層次、背景雜訊、鏡頭光學品質(zhì)等影響畫質(zhì)的因素;就數(shù)字音樂文件而言,記錄資料量大小當然也無法直接拿來評斷數(shù)字音樂整體表現(xiàn)之優(yōu)劣,即使以同樣的格式編碼,不同的原始錄音依舊有高低之分,這是在錄音師一開始將音樂收錄至母帶時就已決定了。另一方面,即便是同一曲目的64fs DSD、128fs DSD或24bit/192kHz PCM數(shù)字音樂文件,交給各個品牌相對應之DAC解碼播放,最終所得到之音樂重播表現(xiàn),還是與各DAC器材的整體素質(zhì)(包括電源、機箱、抑震、解碼、模擬電路等)有密切關系,各位千萬不要再有「DSD=贊」的錯誤迷思!
事實上,追到源頭的專業(yè)錄音業(yè)界,也有專業(yè)錄音師對DSD有所質(zhì)疑,而加拿大滑鐵盧大學(University of Waterloo)的教授Stanley Lipschitz和John Vanderkooy更主張DSD的單位元轉(zhuǎn)換并不適合高階音訊運用,為此他還在美國音頻工程師學會(AES,Audio Engineering Society)發(fā)表了一篇研討會論文撰述(請見這里)。2012年德國慕尼黑音響展會場「高解析度:數(shù)字音樂的未來」講座實況。
此外,「純正DSD」錄音的市佔率遠低于多位元PCM錄音、DSD母帶必須制作成PCM格式、DSD在高頻段有抖動噪音(dithering noise)與動態(tài)范圍表現(xiàn),都是DSD所要面對的問題,不信嗎?2012年德國慕尼黑音響展會場,有一場「高解析度:數(shù)字音樂的未來」講座(見上圖),邀集了Antelope Audio(頂尖DAC品牌)總裁Igor Levin、挪威2L唱片公司創(chuàng)辦人Morten Lindberg(錄音制作人、音色平衡工程師)、HighResAudio高解析音樂下載服務網(wǎng)站的Lothar Kerestedjian及Manger Audio(發(fā)燒平面振膜喇叭品牌)的總裁Daniela Manger等相關軟硬體專家,雖然已時隔一年,但此講座先進完整的論述仍是對高解析度數(shù)字音樂有興趣者很有用的參考資訊。Antelope Audio將這場歷時約35分鐘的講座拍攝下來并放上YouTube網(wǎng)站,以下我們截取其中簡報圖檔作重點說明,也附上完整影片播放的連結給各位參考。
Antelope Audio總裁Igor Levin演說(完整影片觀賞連結:Part 1、Part 2)
多位元PCM的原理是將模擬波形取樣量化,橫軸代表時間、縱軸則為振幅大小,音樂CD的16bit/44.1kHz就代表每秒鐘取樣44,100次,每次得到的量化數(shù)值則能以16位元記錄(2的16次方,也就65,536階)。上圖由右至左表示「取樣頻率」(橫軸)及「量化精度」(縱軸)越來越高,數(shù)字化的結果也越能接近原本的模擬波形(「量化精度」由右至左分別為24bit、16bit與12bit)。
音樂CD的44.1kHz量化與約8.7倍的384kHz取樣頻率比較,后者單位時間取樣點的數(shù)量是8.7倍,再加上縱軸有更多位元數(shù)可標記的量化數(shù),顯然比音樂CD更能完整地描繪音樂波形。與64fs DSD相比呢?「理論上」16bit/176.4kHz的PCM信號就可比擬,至于128fs DSD則相當PCM的16bit/352.8kHz,這意味著配備384kHz及高于16bit的PCM解碼有更高的資訊量。
此圖顯示多聲道PCM的取樣時基誤差(sample jitter),藍色虛線顯示各取樣點與原波形(果綠色曲線)之誤差,Igor Levin以此來強調(diào)精準數(shù)字時鐘之重要性。
這是典型數(shù)字模擬轉(zhuǎn)換芯片的架構,傳統(tǒng)音樂CD的44.1kHz訊號進來,首先作的是插補升頻的動作,再來是Sigma-Delta轉(zhuǎn)換,接著才進行數(shù)字模擬轉(zhuǎn)換動作。當然升頻插補品質(zhì)的好壞,跟最終數(shù)字模擬轉(zhuǎn)換之后的音樂重播品質(zhì)有很大的關系,為了避免升頻處理所帶來的失真,DSD處理的想法因此而生。
這是在前述數(shù)字模擬轉(zhuǎn)換架構之前,由Sigma-Delta模組加上模擬數(shù)字轉(zhuǎn)換(上圖上半部左側部分),接著由數(shù)字濾波器(Digital Filter)降頻,接著再送入后續(xù)數(shù)字模擬轉(zhuǎn)換程序。不過,眼尖者一定會發(fā)現(xiàn)先經(jīng)由數(shù)字濾波器降頻再插補升頻之不合理,將這兩個步驟去掉后,變?yōu)樯蠄D下半部紅色箭頭直通,就是DSD方式的處理流程,乍看似乎很理想,但實際運作卻并非完全與預期相符。
Igor Levin條列說明DSD編碼所遭遇的問題,其中最重要的是第三點,由于當前專業(yè)錄音業(yè)界所有母帶處理(mastering)設備都是PCM規(guī)格,并無法對DSD直接作處理。所以,即便最終呈現(xiàn)的是DSD格式,但在母帶處理過程都得先轉(zhuǎn)換為PCM,之后再轉(zhuǎn)為DSD格式,這使得DSD去除插補失真的好處蕩然無存。此外,單位元處理在高頻段的噪音無可避免較高,而動態(tài)范圍性能也較差。
接著,Igor Levin不免要「老王賣瓜」一番,畢竟Antelope Audio是全球率先推出達384kHz超取樣處理DAC的廠家,他表示將取樣頻率提高到一般192kHz的兩倍之后,數(shù)字濾波處理的幅度就變得非常輕微,因此也大幅降低了失真。另一方面,384kHz PCM信號完全相容所有母帶處理,也很容易儲存為WAV或FLAC格式,兩倍細密的取樣時間間格,也使其波形更接近純粹的模擬波形。
更高的取樣頻率好處其實不只于此,Igor Levin表示它帶來更高的極高頻延伸性能、降低了DAC內(nèi)部處理的失真、優(yōu)化母帶處理也更接近模擬原音。
對于黑膠玩家而言,Igor Levin認為有了384kHz超高取樣,也是可以開始將黑膠唱片收藏開始「數(shù)字化」的時刻了,埋藏在黑膠唱片溝紋里的音樂訊息,經(jīng)由384kHz ADC作模擬數(shù)字轉(zhuǎn)換數(shù)字化,再經(jīng)由384kHz DAC解碼播放,已可相當接近原始純粹的模擬音源。
那么,地球上有這種既能作384kHz ADC又可384kHz DAC的器材嗎?有的,就是去年于德國慕尼黑音響展作全球首演的Antelope Audio Rubicon!不僅384kHz ADC與DAC全包了,它還擁有USB介面與耳擴、前級功能,更配備該廠技冠群雄的超低誤差超精準原子鐘(每一千年誤差僅一秒),各位可點擊這里查閱。
挪威2L唱片公司創(chuàng)辦人Morten Lindberg演說(完整影片觀賞連結請點這里)
接著由2L唱片公司創(chuàng)辦人Morten Lindberg以「高解析度音樂錄音」(Recording Music in HiRes)為題進行解說,2L是以高傳真錄音為職志的公司,他們在全球各地以高解析度錄音捕捉音樂之美好面貌,上圖所看到的就是2L所使用的「麥克風『樹』」,多支麥克風被鎖固在特殊支架上,分別在不同的高度朝向不同的方位,以完整截取錄音空間內(nèi)的音樂氛圍。
Morten Lindberg以此圖說明數(shù)字音樂文件的模擬數(shù)字轉(zhuǎn)換過程,2L的原始錄音是5bit/5.6448MHz格式,正如同前面Igor Levin所強調(diào)的,DSD格式無法進行母帶處理,因此2L先將5bit/5.6448MHz轉(zhuǎn)換為24bit/352.8kHz的「DXD」規(guī)格,方能進行剪接、混音、母帶處理等動作,這是2L真正的「數(shù)字母帶」,之后再處理為24bit/192kHz、24bit/96kHz或64fs DSD數(shù)字音樂文件。對了,既然2L的「數(shù)字母帶」是24bit/352.8kHz的LPCM規(guī)格,為何沒有處理為「整數(shù)倍」降轉(zhuǎn)的24bit/176.4kHz或24bit/88.2kHz呢?Morten Lindberg表示如果為「即時轉(zhuǎn)換」處理,「非整數(shù)倍」取樣頻率確實會比「整數(shù)倍」來得差,但由于2L處理數(shù)字音樂文件時并非「即時處理」,因此能做到兩者沒有分別,但由于2L認為未來高解析度音樂文件之發(fā)行,必須要與影像載體(例如現(xiàn)在的BD藍光光碟)規(guī)格相容,因此以48kHz取樣頻率的整數(shù)倍呈現(xiàn),是較為妥當?shù)摹?/p>
HighResAudio高解析音樂下載服務網(wǎng)站Lothar Kerestedjian演說(完整影片觀賞連結請點這里)
HighResAudio是全球唯一的高解析音樂下載平臺,只提供純粹、原生的原始錄音室母帶檔案,包括FLAC、ALAC、DXD與DSD等格式,由88kHz至384kHz的取樣頻率,含括古典、爵士等不同音樂類型,整張專輯購買價由16.9歐元起跳(也可選定單曲購買)。
這張簡報說明HighResAudio網(wǎng)站概況,主力消費族群在25至54歲之間,而且各世代的分布非常平均。
HighResAudio網(wǎng)站成立于2011年2月,但到2012年5月旗下就有多達44個唱片品牌銷售,而且Lothar Kerestedjian表示每個月都持續(xù)增加2至3個新品牌,可見高解析度音樂購買下載的風潮越來越盛。
Lothar Kerestedjian用兩張圖像來解說高階析度音樂的好處,左圖代表CD等級、右圖則為Apple所提供256kbps AAC,兩者的影像解析度與傳真度,正如同兩種音樂格式之音樂傳真度差距。當然,素質(zhì)提昇到高解析數(shù)字母帶檔案,就能比音樂CD有更寫實傳真之音樂重播。
高解析數(shù)字音樂母帶檔案價格很高嗎?其實不然,HighResAudio網(wǎng)站整張專輯的售價僅比CD高出三成、與180公克黑膠唱片相當、相較SACD或XRCD便宜許多,而且高解析數(shù)字音樂母帶還可單曲購買,由上面這張比較表可發(fā)現(xiàn)確實其售價相當有競爭力。
Lothar Kerestedjian對高解析數(shù)字音樂母帶銷售的前景十分看好,HighResAudio網(wǎng)站認為全球發(fā)燒音響迷總數(shù)在250萬人以上,他們都是高解析數(shù)字音樂母帶的潛在客戶。
Manger Audio總裁Daniela Manger演說
Manger Audio是以特殊全音域平面振膜單元聞名的喇叭品牌(老板兼設計師Josef W. Manger耗費了十四年時間研究),他們還出版了一張音樂測試片,幾乎是音響迷人手一張的發(fā)燒錄音,該CD及LP封面就是以Manger單元的正面為主要圖案(上圖左側,Manger測試片介紹請見這里),至于上圖右側所見到的則是Manger單元的內(nèi)面。
Manger Audio總裁Daniela Manger上場時,先詢問大家是否有人認為自己可聽到16kHz或20kHz以上的極高頻,結果在場沒有任何人舉手。她立即反問,那麼更高的取樣頻率對聽感有影響嗎?因為就物理學而言,96kHz取樣頻率音樂可得到48kHz的頻寬(192kHz取樣頻率則為96kHz,餘此類推),人類的聽覺對時間相位極為敏感,因此對20kHz以上的極高頻雖然聽不見,但實際上是可以感受到其變化的,最新的研究報告指出,人耳結構可分辨短至幾微秒 (microsecond,百萬分之一秒)的時間變化,這使得人耳可分辨音樂里的極微小變化。
這是人耳耳膜對不同高低頻率的感應,越高的頻率在越靠近外側的區(qū)域。
人類的左右耳可敏銳分辨同一猝發(fā)音到達左右耳的極短暫時間差,并感受到快速起伏變化的暫態(tài),也因此能分辨不同樂器之音色,這也是為何高解析度音樂「聽起來」更接近「原音」的關鍵。
Daniela Manger接著將主題轉(zhuǎn)到其父親所發(fā)明、Manger特殊的「彎曲波」(bending wave)單元,上圖所顯示的是一般最常見的動圈式喇叭單元,由于越高的頻段需要越快的暫態(tài)反應速度,因此在全頻段范圍必須切割為高、中、低三個發(fā)聲單元,以時間相位衡量三者的發(fā)聲是不一致的。
此圖左上角顯示輸入喇叭單元的電氣訊號,右上角則為人耳所聽見的暫態(tài)反應曲線。比對左下角之一般三音路喇叭與右下角Manger全音域平面振膜單元,顯然Manger單元更接近人耳應聽聞之表現(xiàn)。
這是Manger「彎曲波」(bending wave)平面振膜單元的側面結構圖,其圓形振膜是多層不同厚度的「三明治結構」,靠近中央的部分較薄、用于發(fā)出高頻,中間一圈較厚一些用于中頻,至于外側最厚的振膜則對應更低的頻率。
這是Manger平面振膜全音域單元發(fā)出不同頻率時,由雷射儀掃瞄其振膜震動能量之圖形,可以發(fā)現(xiàn)所有頻率都是近似同心圓的發(fā)聲狀況。此全音域單元涵蓋由100Hz到45kHz的寬廣范圍,利用振膜厚薄不同的物理性「機械分音」,使其發(fā)聲精準且效率極高,更可敏銳重現(xiàn)高解析音樂的細微暫態(tài),只要底下再銜接一支超低音單元,就可完整重現(xiàn)完整頻段的音樂訊息。
總之,要得到良好的高音質(zhì)音樂重播,從音樂載體或檔案本身、播放訊源、放大器、喇叭到連接各組件的線材,環(huán)環(huán)相扣、全都必須用心呵護關注,即使同一格式數(shù)字音樂文件以不同訊源播放,也會得到不一樣的音樂重播表現(xiàn)??赐暌陨系恼f明,您還會認為DSD編碼就是「絕對好聲」的同義詞嗎?器材本身的素質(zhì)實力,以及用家對音響系統(tǒng)所投入調(diào)整的用心程度,應該才是好聲與否的關鍵!
聯(lián)系客服