迎接專業音頻世界的AoIP時代
1 引言
AoIP(Audio over IP)是指在普通以太網上以IP(Internet Protocol,互聯網協議)流的方式實時傳送高保真數字音頻信號的技術,可適用于包括現場擴聲在內的諸多專業音頻領域。它不同于VoIP(Voice over IP),雖然VoIP也用IP來傳輸音頻,但其碼率低,音質僅限于話音級水平,通常只能用于網絡電話通信;另外,AoIP也不同于互聯網音頻,點播或直播方式下的互聯網音頻使用高壓縮比算法,存在緩沖時間長、音質損耗大、容易丟幀等缺點,不適合對音質和時延有著較高要求的專業場合使用。
AoIP的高保真含義是指44.1kHz以上的采樣率、16 bit以上的線性量化(通常是48 kHz采樣,24 bit量化),以及低的延時(百微秒至毫秒級),且不采用任何有損或無損的壓縮處理;這樣的傳輸指標已接近于AES3和MADI標準,即便是毫秒級的延時也完全能滿足會議、演藝、體育比賽等現場擴聲的需求。
以太網是最常見的高速數據傳送和交換的網絡,是現代IT的基礎。當前已進入百兆和千兆網時代,從理論上來講,理想狀況下的百兆以太網能雙向對傳各56個通道的24 bit/48 kHz的線性音頻信號,而千兆網則超過了500路。人們也許找到了一個廉價高效的數字化之路,從而替代傳統的模擬和數字電纜來傳送和分配音頻信號。
然而,以太網建立之初是用來連接計算機的,它遵循IEEE802.3標準,使用邏輯總線型拓撲結構和CSMA/CD來進行信息交換,這一點證明以太網天生就不是為傳送實時音視頻信號而設計的;IP更是伴隨互聯網而來,IP包傳送過程中的不確定性更為提供這類服務增添了難度。必須提供某些機制來克服這些障礙:首先是同步,從網內各個節點進出的數字音頻信號必須保證嚴格同步,否則,即便是細微的采樣率偏差也會因緩存的枯竭或溢出導致數據錯誤;其次是流量的管控,這是實時音頻流能夠連貫不中斷地從起點到達終點的主要保證,特別是當網路內同時存在其他類型的不可測流量時,這一點尤為重要;最后,在以太網和IP環境下必須對接入設備和鏈路進行有效的監測和管控,從而確??煽啃院涂刹僮餍?。
這些都是AoIP需要面對和解決的問題,好在IP技術已經發展到了包羅萬象、幾乎無所不能的時代,其實不需要發明任何新的技術和協議, 就能巧妙解決這些所謂的難題。
· IEEE1588的全稱是《網絡測量和控制系統的精確時鐘同步協議》,已被廣泛應用于電力系統和通信系統的同步,IEEE1588能通過主從節點間時間報文的發送和誤差測量,來實現兩者頻率和相位同步(見圖1),精度優于100 ns,如果將此技術應用在AoIP的媒體時鐘傳遞,同步已經不是問題。
· 目前企業級的交換設備基本都具備了服務質量(QoS)功能,能通過對以太網幀DSCP字段進行標識來區分時間敏感流量和普通流量,從而讓AoIP流優先通行,以保證它的實時性。
· 利用IP通信技術對分布式的設備進行網絡管理已非常成熟??傊?,在較好地解決這些問題之后,開始跨入AoIP時代。
·
2 當前網絡音頻技術分析
利用以太網傳輸高品質的音頻流其實并不是這幾年才有的事,最早可追溯到20世紀90年代末出現的CobraNet,以及Digigram的EtherSound等,直到最近幾年又陸續推出了AVB、Dante、Ravenna等新一代的網絡音頻技術。
2.1 CobraNet
1996年,美國PeakAudio公司推出了代號為眼鏡蛇網絡的以太網音頻傳輸方案——CobraNet,該公司于2001年被芯片生產商Cirrus Logic收購,并以提供配套板卡和專用DSP芯片的方法將CobraNet迅速推廣(見圖2)。QSC是最早與PeakAudio合作并實現CobraNet商用的公司,首個固定安裝的應用場合是迪斯尼動物王國,Cirrus Logic的介入大大降低了CobraNet的門檻,一些音頻廠商開始使用CobraNet,其中包括Peavey、BIAMP、Symetrix、dbx等,媒體矩陣是CobraNet最主要的應用領域,Yamaha、Soundcraft等也在其數字調音臺上添加了CobraNet接口,除此之外的應用還包括功率放大器和有源揚聲器系統等。
CobraNet能夠在普通五類網線上傳輸多達64路20 bit/48 kHz音頻信號,并利用通用的以太網設備進行組網。其不同于傳統系統的顯著優點
是:在不改變布線的情況下,能夠通過軟件對音頻通道的路由進行任意配置,既支持點對點,也支持點對多點,這種簡潔靈活的特性使得CobraNet在各類中大型音頻系統如機場、主題公園、商業中心、廣播電臺等獲得廣泛的應用。
與現有AoIP體系普遍支持標準IP不同,CobraNet使用了一套自有的專用方案:CobraNet以網絡中某一設備(Conductor)不斷發送節拍包(BeatPacket)的方式獲得網絡采樣時鐘的同步。雖然CobraNet也是一個同步網絡,但它并沒有使用主流的IEEE1588;CobraNet的音頻傳送是通過Bundle來實現的,Bundle是CobraNet特有的封裝形式,Bundle不通過IP承載直接打包成以太網幀。雖然部分網管經由IP完成,但從核心技術上來講,CobraNet只能算是一個二層(數據層)技術,并不能劃在AoIP之列。鑒于上述原因,CobraNet存在以下缺陷或弱勢。
· 由于Bundle與IP的潛在沖突,為了獲得穩定可靠的應用必須為CobraNet建立獨立的專用網絡,并交給CobraNet去管理,這一點限制了它的推廣價值。其實目前三層(網絡層)QoS技術完全能保障AoIP與其他業務共網同傳,從而可利用現成的網絡來傳輸音頻,這將節約大量的基礎投入,并使系統變得簡單高效。
· CobraNet是一個不公開的企業內部標準,近十年來,其核心技術并沒有實質性的發展,技術與容量尚停留在百兆網年代,在帶寬、時延、接入通道數量等方面已經沒有了優勢,與當今突飛猛進的IT相脫節,技術的差異性也導致它不可能與當前其他體系的AoIP系統實現互聯互通,只能建立孤立的系統,即便是不同廠商間的CobraNet產品,也呈現出較差的兼容性。
2.2 AVB
AVB的全稱是以太網音視頻橋(Ethernet Audio/Video Bridging),是一項新的IEEE802標準,其在傳統以太網絡的基礎上,通過保障帶寬(Bandwidth)、限制延遲(Latency) 和精確時鐘同步(Time synchronization),以支持各種基于音頻、視頻的網絡多媒體應用。
AVB跨越了數據鏈路層和網絡層等多個層級,涉及TCP/IP協議組的大部分層次,但其結構還是基本保持并兼容現有以太網體系,只是對其部分功能進行擴展,增加和修訂的協議主要包括:
· 精準時間同步協議——IEEE 802.1AS;
· 流預留協議——IEEE 802.1Qat;
· 隊列及轉發協議——IEEE 802.1Qav;
· 音視頻橋接系統——IEEE 802.1BA。
AVB為視頻而生,因為視頻的傳輸速率需求比音頻大得多(24 bit/48 kHz音頻碼率約為1.2 Mb/s,1 080 p的HD視頻達3 Gb/s,4K視頻更高),因而對網絡基礎架構提出了非??量痰囊螅ㄈ鐣r鐘抖動),AVB就是試圖改造以太網的第二層來實現這一目標,完全意義上的AVB必須升級以太網交換機為AVB交換機才能實現。但如果只是單純傳輸音頻的話,為使用AVB而升級交換機顯得有些浪費和得不償失,因為除AVB外的其他AoIP方案都可以直接使用普通交換機。
AVB的研究始于2005年11月,幾年前還比較熱門,但隨著專業電視領域SMPTE2022-6取代AVB成為發展主流,AVB的推廣受到一定的影響,AVB在網絡音頻領域的應用也呈現停滯態勢,相關的產品和系統僅限于較小的范圍內。
2.3 Dante
Dante來自澳大利亞Audinate公司,是目前使用范圍最廣、擁有產品數量最多的AoIP技術(有超過300家授權廠商和800余種相關產品,其中也包括Hamann、Yamaha等)。Dante使用IEEE1588來進行音頻時鐘的同步,使用UDP進行音頻數據流的傳輸并同時支持單播和組播;Dante擁有一整套完整的管理機制和流程:包括設備發現和配置、音頻流的路由和切換、系統故障診斷和主備冗余等;虛擬聲卡(Dante-virtual-soundcard)能將PC或MAC通過本機網口轉換為Dante設備,省去轉接環節而直接進行多音軌的錄放;Dante在千兆網實測通道數(48 kHz/24 bit)超過400個,單跳時延最短為168.8 μs。
Audinate自身并不研發和制造音頻設備,只出售核心板卡(BrooklynII)和芯片(Ultimo)給授權客戶并提供開發支持,成熟的解決方案和便捷的開發流程使眾多的音頻廠商很快將他們的產品升級成支持Dante的新設備,大大加速了Dante推廣的進程,這正是Audinate成功的秘訣;同時,用戶還得到了額外的福利:由于使用相同的接口板卡和芯片、以及同一套管理軟件DanteController,不同廠商設備間的互聯變得非常方便,兼容性也比較好(見圖3)。
然而,值得注意的是,盡管Dante有著這么廣的市場占有率,至今卻仍是一個不開放的企業內部標準,未來是否會重蹈CobraNet的覆轍,這確實是其面臨的又一個風險,后文將繼續這方面的討論。
目前專業市場能見到的AoIP體系主要還包括以下幾家(見圖4)。
· RAVENNA:RAVENNA由著名調音臺制造商L AWO旗下的AlC NetworkX于2010年9月正式對外發布。與CobraNet和Dante不同的是,RAVENNA一開始就是一個完全公開的AoIP協議,RAVENNA幾乎具備了現代AoIP的全部技術特征,并成為AES67的制訂基礎(后文詳述)??上У氖?,RAVENNA的使用者只局限于廣播電視專業領域,并不被演藝行業的擴聲技術人員所了解。
· Livewire+:Livewire首次亮相于2003年的NAB展,被視為最早的AoIP系統,歸屬于Telos聯盟的Axial Audio,之后與RAVENNA合作并升級為Livewire+。Livewire+目前主要在Telos聯盟內各子公司使用,并在廣播電視市場占有一席之地。
· Q-LAN:Q-LAN是美國QSC音頻產品有限公司為Q-Sys音頻網絡處理平臺開發的第三代AoIP專有技術,相關產品包括Q-SysCore核心處理單元、I/O接口單元以及管理軟件等,主要應用場合是包括迪斯尼在內的園區擴聲系統。
· Wheatnet-IP:Wheatnet-IP是美國惠斯登(Wheatstone)公司自用的AoIP協議。Wheatstone的核心業務是研發和制造各類數字調音臺及相關傳輸處理設備。
3 標準化之路
前文討論了一系列的AoIP技術,這些技術是由不同廠商和機構在世界各地獨自研發制訂的,盡管都使用了類似的核心協議,如IEEE1588、RTP/UDP等,但由于技術路線與細節的差異,它們彼此之間相互獨立,并不能互相通聯,只能單獨構建系統,這將大大限制未來AoIP的發展;同時,如果AoIP技術只是個別企業的自主技術,在安全性、適用性、經濟性、可發展性等方面并不利于整個行業的發展。因此,制定與AoIP相關的公開標準,擺上了議事日程。
3.1 AES67-2015
AES(音頻工程協會)代號為SC-02-12-H的標準化工作組,在2010年12月啟動了一個叫X192的項目,希望在現有技術的基礎上定義一個可互通的方案,以實現不同廠商AoIP設備之間的互操作,該標準于2013年9月正式頒布,取名為AES67-2013(AES standardfor audio applications of networks -High-performance streamingaudio-over-IP interoperability),此后又經過了一次修訂,現在的版本是AES67-2015。
AES67從同步、媒體時鐘、傳輸、編碼成流、會話描述、發現服務、連接管理等方面闡明并規范了AoIP的機制和具體細則,特別是對基于IEEE1588v2的同步機制和RTP流的單組播傳輸方案作了明確的定義,這使得不同廠商AoIP設備和系統間的時鐘對接和音頻數據流對接成為可能。
2014年10月,媒體網絡聯盟(Media Networking Alliance)成立,由LAWO、QSC、Yamaha等8家公司聯合發起,目的是致力于AES67的推廣,在不到三年的短短時間內,已有RAVENNA、Livewire+、Dante、Q-Sys、Wheatnet-IP等幾乎全部主要的AoIP體系正式宣布支持AES67,音頻工程協會也于2014年10月和2015年11月在慕尼黑和華盛頓分別組織了兩次AES67兼容性測試,測試結果表明不同廠商AoIP產品間的互通性還是令人滿意的。
在國內,由中央人民廣播電臺牽頭的GY/T 304-2016《高性能流化音頻在IP網絡上的互操作性規范》行業標準已完成審核,該標準采自AES67-2015,并于2017年1月4日正式由國家新聞出版廣電總局批準發布。
最后特別需要指出的是,AES67僅定義了涉及AoIP互聯互通的最基本部分,解決的也只是最簡單的單播和組播流的對接,并不是AoIP的全部。與AES/EBU、MADI等傳統數字音頻接口技術相比,AoIP復雜得多,涉及設備發現與配置、信號調度、監聽監測、診斷分析、冗余備份等諸多方面,需要一整套完善的網絡管理機制,對于這些AES67并沒有給出明確的說明,目前仍需要各個AoIP體系自己去定義和實施,比如Dante只是開放了部分BrooklynII節點去發送和接收第三方的AES67音頻流,除此之外,保存了原有的完整架構不變。從這種意義上來說,AES67更傾向于用在不同AoIP系統之間作橋接,而不是只用AES67就能獨立構造完整的AoIP應用系統( 見圖5)。
3.2 AES70-2015
AES于2016年1月又發布了一個與AoIP有關的標準——AES70-2015,它的全稱是《面向網絡音頻應用的開放式控制架構》(AES standard for Audio applications of networks -Open Control Architecture)。從字面上看,應該是一個利用網絡對音頻設備進行控制的標準。
其實,AES70來源于OCA聯盟,它由Bosch、TC、Yamaha 等9家公司發起,OCA于2014年底正式成型,隨后成立AES X210 工作組,負責將OCA1.3轉化成AES70-2015。
一般來說,音頻技術人員對MIDI都不陌生。MIDI是一種樂器數字接口,它并不傳遞任何音頻信號,傳輸的是音符、音量等MIDI控制信息。而AES70就好像是AoIP域的MIDI,它以IP方式在入網的數字音頻設備及非音頻設備之間傳遞各類控制信號,以達到監測、控制和管理的目的。AES70提供了一個非常完備的基于IP網絡的音頻監管框架,具備良好的安全性、可用性、魯棒性(robustness)、兼容性、以及可擴容性和可分析性。
前文提到AES67解決了AoIP流的對接問題,在控制層面上卻存在較大的空白,因此AES67可稱為“Audio Streamover IP”,而相反,AES70是個控制協議,即“Audio Control over IP”,兩者的結合AES67+AES70才可能成就一個完美的AoIP。通過AES70,AoIP系統能完成網絡中的設備發現、媒體流的監測和拆除、設備的配置和操控、系統的監測和管理等AoIP的控制功能;另外,AES70除了支持AoIP外,還能廣泛應用于基于以太網的音頻設備的監測和管理,包括信號處理(增益、動態、均衡、混音等)、電平監測、頻譜分析、快照管理等,甚至還能對設備進行遠程復位和升級。
現在,AES70的開發和推廣剛剛啟動,前景和成效拭目以待。
4 AoIP應用展望
當今科技發展的趨勢,IP化已經是不可抗拒的潮流,經由物物相聯,IT思維已開始滲透到了每一個行業,這種跨界發展的結果,對一大批行業將產生顛覆性的影響,甚至推倒重建。IP之所以具備這么大的威力,是因為在其背后隱藏著人類的智慧和無盡的可能,因為通過IP可將萬物聚為一體,并連接云計算和大數據,才能發揮出不可想象的功效,IP是開啟人工智能時代的一把鑰匙。
AoIP的出現為專業音頻走向IT掃清了最后的障礙,是融入IT大家庭的入場券,專業音頻因此也能共享到IT發展帶來的種種福利和變革,下面筆者就AoIP未來在專業音頻領域的應用,作一個簡要的分析和展望。
· 隨著越來越多的數字音頻設備具備AoIP接口和功能,專業音頻系統的物理架構和構造方法將發生重大變化。目前已經出現一大批帶有Dante接口的數字調音臺、功率放大器、有源揚聲器系統,甚至是無線傳聲器,而且發展呈上升趨勢,主流媒體矩陣也大多具備了類似的接口;一根超五類或六類電纜可容納數以百計的原汁原味的低延遲音頻通道,如果將這些AoIP設備通過網絡交換機連接到一起,便組成了一個海量信號池,每個通道信號均能做到按需調度和分配。由于這種分配是通過IP流在網絡中的軟路由實現的,并不會占有具體的物理線路,這就省去了以往搭建系統過程中需要架設的大量的模擬和數字電纜(只需要將每個設備用一根網線就近接入交換機即可)。線路復雜度和成本大幅下降;系統規??梢宰龅酶?;拆除、添加或更換設備變得異常容易;能夠根據具體的環境特征建立相應的傳輸拓撲結構,比如舞臺和控制室星形接入,再將兩者集中互連。另外,現有的AoIP系統都已具備了主備冗余的功能,通過成熟的網絡備份技術,就能應對安全性要求苛刻的場合(見圖6)。
· 系統的整體性和協調性得到強化。隨著AoIP標準化時代的來臨,每個專業音頻系統都將有條件設立統一的網管,經由網絡集中完成在線配置、路由、監測、診斷等管理任務;能夠通過軟件來定義各類應用,以前只對單一設備能進行場景的預設和加載,而現在則可以對整個系統進行個性化參數的統一定義和切換,比如一個劇場能通過軟件快速在會議、音樂會、演唱會等模式間切換;通過網管,還能調度所有設備協同完成整個系統音頻參數的優化,如嘯叫抑制等;通過網管,能集中監測監聽系統內各設備的實時工作狀態,并開啟自動報警,實施災備切換。
· 邁向更高的智能化。專業音頻將遵循從模擬到數字,進而通過網絡化最后邁向云化和智能化的發展歷程。未來也許真的可以用云來構建音頻系統,而傳統的音頻處理都將是云計算空間內的虛擬物件,只留下AoIP來聯接傳聲器和揚聲器。
選自《演藝科技》2017年第2期陳武,高天增《迎接專業音頻世界的AoIP時代》,轉載請標注:演藝科技傳媒。更多詳細內容請參閱《演藝科技》。