作為國(guó)內(nèi)知名的音頻芯片廠商炬芯科技,不但于去年在音頻領(lǐng)域進(jìn)入了小米、魅族等幾家大公司的供應(yīng)鏈,現(xiàn)在也開始聚焦音頻AI領(lǐng)域,推出了一系列的智能語音產(chǎn)品和解決方案。12月15日,炬芯科技在深圳舉行了針對(duì)智能語音技術(shù)的專屬品牌活動(dòng):炬芯科技2017 TcehLife開發(fā)者交流大會(huì)。AWResmc
單麥克風(fēng)or麥克風(fēng)陣列,語音交互該選用怎樣的方案?
本次的TechLife活動(dòng)交流分享環(huán)節(jié),炬芯特邀地平線語音前端處理技術(shù)負(fù)責(zé)人,南京大學(xué)聲科學(xué)與工程系教授,噪聲控制與通信聲學(xué)研究室主任盧晶盧教授,為大家針對(duì)智能語音交互的“金耳朵”語音前端處理技術(shù)進(jìn)行了深度分享。AWResmc
AWResmc
據(jù)WER統(tǒng)計(jì),目前最頂尖的語音識(shí)別技術(shù)的誤識(shí)率是3%,已經(jīng)與人類聽力的誤識(shí)率持平,但是WER統(tǒng)計(jì)大多數(shù)針對(duì)安靜場(chǎng)景的語音數(shù)據(jù),在復(fù)雜環(huán)境中語音性能顯著惡化。人耳能夠自動(dòng)屏蔽掉周圍的噪音,只關(guān)注你想聽到的聲音;但是機(jī)器做不到,在語音識(shí)別系統(tǒng)看來所接收到的所有聲音重要性都是一樣的,無法區(qū)分噪音和聲音,在復(fù)雜環(huán)境下語音識(shí)別率自然會(huì)下降。AWResmc
AWResmc
因此,智能語音技術(shù)的發(fā)展讓語音前端處理的重要性日益凸顯。不僅要像手機(jī)、藍(lán)牙耳機(jī)、助聽器的語音前端處理系統(tǒng)一樣實(shí)現(xiàn)降噪,還要進(jìn)一步還原語音,讓要讓機(jī)器聽得懂,進(jìn)而提升語音識(shí)別和說話人識(shí)別系統(tǒng)的實(shí)用性和識(shí)別率。AWResmc
盧晶盧教授表示,目前對(duì)干擾噪音的抑制有單麥克風(fēng)和麥克風(fēng)陣列兩種方案。其中單通道方案的關(guān)鍵點(diǎn)是噪聲功率譜的有效追蹤和語音邊界檢測(cè),也可以基于深度學(xué)習(xí)的方案提升抑制干擾噪聲的能力。單通道方案優(yōu)點(diǎn)是結(jié)構(gòu)簡(jiǎn)單,硬件成本低,對(duì)平穩(wěn)噪聲效果明顯,但弱點(diǎn)是對(duì)非平穩(wěn)噪聲處理效果不佳。AWResmc
麥克風(fēng)陣列由一組按一定幾何結(jié)構(gòu)(常用線形、環(huán)形)擺放的麥克風(fēng)組成,對(duì)采集的不同空間方向的聲音信號(hào)進(jìn)行空時(shí)處理,實(shí)現(xiàn)噪聲抑制、混響去除、人聲干擾抑制、聲源測(cè)向、聲源跟蹤、陣列增益等功能,進(jìn)而提高語音信號(hào)處理質(zhì)量,以提高真實(shí)環(huán)境下的語音識(shí)別率。AWResmc
AWResmc
理論上來說,麥克風(fēng)數(shù)量多多益善,但系統(tǒng)的實(shí)現(xiàn)必須考慮性價(jià)比。那么,對(duì)于開發(fā)者來說,該如何平衡語音前端硬件系統(tǒng)的性能和價(jià)格呢?盧晶盧教授認(rèn)為,在一般應(yīng)用場(chǎng)景,說話人距離3m以內(nèi)可以采用單麥克風(fēng);復(fù)雜場(chǎng)景使用2顆;需要DOA估計(jì)的復(fù)雜場(chǎng)景則需要3-4顆甚至8顆的麥克風(fēng)。AWResmc
AWResmc
聚焦音頻AI,炬芯推出智能語音全系列產(chǎn)品線
炬芯科技技術(shù)專家陶永耀在現(xiàn)場(chǎng)也為大家詳細(xì)的講解了炬芯目前的幾大核心平臺(tái),同時(shí)也對(duì)智能語音的未來發(fā)表了獨(dú)到的觀點(diǎn)。AWResmc
熟悉炬芯的人都知道,炬芯是做音頻起家的,最早做MP3,老人機(jī)、小音箱等產(chǎn)品。陶永耀表示,炬芯未來三到五年仍將重點(diǎn)聚焦以音頻為主線的三大領(lǐng)域,并引入人工智能元素。一是無線音頻和智能穿戴運(yùn)動(dòng)耳機(jī);二是智能多媒體,將原來的老人機(jī)、游戲機(jī)、學(xué)習(xí)機(jī),與人工智能結(jié)合形成跨界的產(chǎn)品。三是智慧計(jì)算與物聯(lián)網(wǎng),包括無人機(jī)、VR/AR、OTT盒子等產(chǎn)品。AWResmc
AWResmc
作為一家芯片廠商,炬芯聚焦解決智能語音平臺(tái)的共性需求,致力于智能語音交互技術(shù)中的前臺(tái)技術(shù)的發(fā)展。主要包括以下四點(diǎn):1.mic陣列語音采集芯片;2整合語音前處理相關(guān)算法;3.整合本地語音識(shí)別引擎;4.雙mic語音前處理模塊。AWResmc
目前炬芯已經(jīng)擁有非常豐富的智能語音產(chǎn)品線,尤其是目前熱門且已經(jīng)成功落地的智能早教機(jī)器人產(chǎn)品。其實(shí)在早教機(jī)器人方面炬芯已經(jīng)推出了比較全面的解決方案,完整布局了低、中、高端市場(chǎng),主要包括ATS3503、ATS3603、ATS3703。AWResmc
AWResmc
針對(duì)火爆的智能音箱市場(chǎng),炬芯在本次開發(fā)者交流大會(huì)上正式推出了全新的智能語音多媒體平臺(tái)。包括面向無屏Linux系統(tǒng)的智能語音平臺(tái)ATS3605D,面向有屏的Android智能語音平臺(tái)有S500、S700、S900,以及一顆支持4-8麥的語音采集套片ATT300X。AWResmc
AWResmc
AWResmc
此外,炬芯還推出了雙模藍(lán)牙平臺(tái)AT3282X和ATB12XX,以及針對(duì)BLE藍(lán)牙智能語音平臺(tái)ATB110X。AWResmc
AWResmc
AWResmc
此前,炬芯科技CEO周正宇博士被采訪表示,人工智能和物聯(lián)網(wǎng)概念一樣的龐大,如果人工智能像物聯(lián)網(wǎng)一樣不追求產(chǎn)品的落地,它將依然得不到人工智能需要追求實(shí)際的產(chǎn)品落地和智能化的用戶體驗(yàn),堅(jiān)持小步快走的微智能化發(fā)展方針才是長(zhǎng)久之計(jì)。炬芯在此次開發(fā)者大會(huì)上充分展示了智能語音全面的產(chǎn)品線,正是基于其小步快走的微智能化發(fā)展方針的最好實(shí)踐。AWResmc
AWResmc
AWResmc
AWResmc