音頻編解碼器是現(xiàn)代媒體系統(tǒng)的基礎(chǔ)核心之一。沒有音頻編解碼器,就不會有現(xiàn)在的數(shù)字廣播、流媒體服務(wù)及音樂發(fā)行。首個主流MPEG音頻編解碼器是誕生于1998年的MP3,此后的16年間,業(yè)界又陸續(xù)開發(fā)和制定了包括AAC、HE-AAC/HE-AACv2、MPEG Surround、xHE-AAC等在內(nèi)的多個音頻編解碼器,極大地改變了我們消費媒體的方式。
下一代電視和OTT的音頻
當(dāng)前,H.264視頻以及HE-AAC音頻是廣播電視和移動應(yīng)用的主流技術(shù)。HE-AAC幾乎無處不在,從數(shù)字電視、藍光播放器、手機、平板電腦,到電視機機頂盒、游戲控制盒、音樂播放器、汽車、數(shù)字廣播等,全球部署總量超過70億臺。同時,HA-AAC也支持所有流媒體播放器、瀏覽器和手機操作系統(tǒng),包括IE9、Safari和使用HDMI輸出6聲道PCM音頻的Chrome在內(nèi)的HTML5瀏覽器。
 Fraunhofer IIS 亞太區(qū)市場及業(yè)務(wù)發(fā)展總監(jiān)Toni Fiedler |
隨著運營商開始陸續(xù)部署下一代廣播電視(NGB)網(wǎng)絡(luò),F(xiàn)raunhofer IIS亞太區(qū)市場及業(yè)務(wù)發(fā)展總監(jiān)Toni Fiedler認(rèn)為,H.265和xHE-AAC成為下一代主流編解碼已是不爭的事實,但“我們的眼光還要看的再遠一些”。于是,專為下一代橫跨電視廣播、互聯(lián)網(wǎng)、移動網(wǎng)絡(luò)傳輸開發(fā)的,基于拓展型HE-AAC的全新音頻編解碼標(biāo)準(zhǔn)MPEG-H 3DA浮出水面。
“個性化、感染力與真實感、可在所有播放器中進行渲染,是NGB網(wǎng)絡(luò)下用戶對設(shè)備音頻提出的新要求?!盩oni Fiedler解釋說,以個性化為例,用戶通過MPEG-H標(biāo)準(zhǔn)可隨意調(diào)節(jié)單一元素(廣播員評論/演員對白)的音量,支持多語種、跨平臺傳輸。為此,F(xiàn)raunhofer IIS在MPEG-H標(biāo)準(zhǔn)中引入了‘音頻對象’的概念,這是一種可以預(yù)定義方式由渲染器處理的聲音元素,重點在于打造全新的互動功能。例如,增加額外的對話框追蹤(如賽車)、改變聲音對象的優(yōu)先順序(如新聞的中原始和錄音音頻)、選擇不同的評論音軌(如足球比賽)、選擇電影中不同的語言等。
對白增強(Dialogue Enhancement)技術(shù)是對“音頻對象”的實用性探索之一。2011年溫布爾登網(wǎng)球賽期間,BBC公司曾成功的舉行過公眾測試,BBC網(wǎng)絡(luò)電臺用戶可以根據(jù)個人偏好隨意調(diào)整對白和賽場環(huán)境音的音量。隨后的調(diào)查顯示,大部分用戶均調(diào)整了音量平衡,調(diào)高賽場環(huán)境音量與調(diào)高評論音量的用戶約各占50%,均表示收聽體驗得到了顯著的改善,且有半數(shù)以上的用戶認(rèn)為該產(chǎn)品特性對體育賽事的直播/轉(zhuǎn)播非常有用。目前,DVB正在將對白增強技術(shù)加入其音頻/視頻工具包規(guī)格(ETSI TS 101 154)中,下一代規(guī)格預(yù)計將于2015年中期公布。
本文為《國際電子商情》原創(chuàng),版權(quán)所有,謝絕轉(zhuǎn)載
本文下一頁:用聲音感動用戶
相關(guān)閱讀:
• Cirrus Logic推出提升用戶體驗的全新語音處理器
• Fraunhofer IIS攜手Digital TV Labs聯(lián)袂推出音頻測試套件
• DIALOG推出兼容超低功耗與“始終開啟”的音頻編解碼器OcXesmc
{pagination}
用聲音感動用戶
什么樣的技術(shù)能夠?qū)⒁魳泛碗娪耙粜У姆諊驼鸷丑w驗帶給移動設(shè)備用戶?“這是個好問題?!盩oni Fiedler說,目前大量移動設(shè)備廠商只關(guān)注CPU核數(shù)、視頻和屏幕分辨率,卻對音頻效果置若罔聞,結(jié)果導(dǎo)致要么無法提供身臨其境的環(huán)繞聲效,要么使用了低質(zhì)量的揚聲器和耳機,從而產(chǎn)生狹隘的立體聲音場、差強人意的聲音質(zhì)量、不自然的聲音色彩和不足的低音。
Cingo虛擬環(huán)繞聲音,一項Fraunhofer IIS專為移動設(shè)備推出的技術(shù),據(jù)稱可讓用戶直接通過內(nèi)置立體聲揚聲器或耳機領(lǐng)略到家庭影院般的音效,并且使現(xiàn)有的立體聲變得更加自然和清晰。此外,由于針對嘈雜環(huán)境配備了響度優(yōu)化功能,Cingo還能夠顯著提升語音或評論的清晰度。目前,Cingo作為一款即用軟件,已全面面向移動設(shè)備生產(chǎn)商、芯片供應(yīng)商和多媒體服務(wù)供應(yīng)商供貨,并成功應(yīng)用于Google Nexus平板電腦、SK Broadband的Btv移動IPTV服務(wù)中。
與觸控技術(shù)一樣,語音(包括語音搜索、語音命令、語音喚醒等)功能,正在人機交互過程中扮演著重要角色。而未來,語音更將成為可穿戴設(shè)備的關(guān)鍵接口之一。因此,為耳機提供數(shù)字化可調(diào)節(jié)噪音減免、提高擴音器音量和揚聲器保護、噪音減免,回聲消除,為“不間斷”應(yīng)用提供超低功率DSP,成為確保移動用戶獲得優(yōu)質(zhì)語音效果的主要方法。
 Cirrus Logic公司混合信號音頻產(chǎn)品營銷與產(chǎn)品管理總監(jiān)Carl Alberty |
“我們的最大優(yōu)勢就在于能夠通過將SoundClear、自動語音識別增強(ASR Enhance)、TrulyHandsfree技術(shù)、超低功耗語音檢測、優(yōu)化硬件和智能系統(tǒng)控制結(jié)合在一起,給智能手機、平板電腦、可穿戴設(shè)備用戶在語音識別準(zhǔn)確度和用戶體驗方面帶來質(zhì)的提升。”Cirrus Logic公司混合信號音頻產(chǎn)品營銷與產(chǎn)品管理總監(jiān)Carl Alberty在推介其最新超低功耗CS48LV12/13語音處理器時如是說。
Cirrus Logic與中國智能手機廠商合作關(guān)系密切,VIVO、ZTE中興、小米等公司均采用其音頻解決方案。其代表性的SoundClear技術(shù)可實現(xiàn)針對窄、寬帶音頻內(nèi)容的單/雙麥克風(fēng)噪聲抑制和聲學(xué)回聲消除,從而帶給用戶在耳機或免提揚聲器模式下優(yōu)良的語音識別及通話用戶體驗,目前已全球交付約7,500萬件產(chǎn)品。此外,為了實現(xiàn)移動設(shè)備中“不間斷”的語音喚醒功能,CS48LV13還支持Sensory公司的低功耗TrulyHandsfree技術(shù),且不會造成電池使用時間縮短。
本文為《國際電子商情》原創(chuàng),版權(quán)所有,謝絕轉(zhuǎn)載
相關(guān)閱讀:
• Cirrus Logic推出提升用戶體驗的全新語音處理器
• Fraunhofer IIS攜手Digital TV Labs聯(lián)袂推出音頻測試套件
• DIALOG推出兼容超低功耗與“始終開啟”的音頻編解碼器OcXesmc
責(zé)編:Quentin