人工智能語音助手正被集成到汽車中,以實(shí)現(xiàn)免提和直觀的功能。和Apple Siri等語音助手可以識(shí)別和響應(yīng)自然語言命令,讓駕駛員能夠更有效地與車輛互動(dòng)。集成自然語音虛擬助手很復(fù)雜,需要大量資源和學(xué)習(xí)和數(shù)據(jù)收集方面的專業(yè)知識(shí)。因此,目前只有少數(shù)公司能夠成功地做到這一點(diǎn)。vajesmc
ChatGPT 的流行促使許多人思考 AI 的潛在應(yīng)用。其中之一是在汽車領(lǐng)域。隨著車輛儀表板的簡(jiǎn)化,出現(xiàn)了將更多功能集成到中央顯示屏的趨勢(shì),例如、娛樂、氣候控制和車輛診斷。車輛中的中央計(jì)算機(jī)變得越來越強(qiáng)大,可以做更多的事情。所有這些都允許駕駛員以更簡(jiǎn)單、更用戶友好的方式與他們的車輛進(jìn)行交互,同時(shí)為車輛本身啟用更高級(jí)和可定制的功能。vajesmc
此外,這與軟件定義車輛的發(fā)展相匹配,后者通過使用集中式軟件架構(gòu)來控制所有車輛功能,使這種集成更進(jìn)一步。這允許更大的靈活性和通過空中 (OTA) 更新車輛系統(tǒng)的能力。vajesmc
人們?cè)絹碓叫枰獙⒏郊庸δ芗傻街醒腼@示屏中,例如語音助手、車載數(shù)字助理和其他高級(jí)駕駛員輔助系統(tǒng) ( ADAS )。然而,過度簡(jiǎn)化會(huì)導(dǎo)致許多問題。盡管現(xiàn)代汽車普遍采用觸摸屏顯示器,但有些人仍然喜歡在汽車駕駛室中使用旋鈕或按鈕。以下是一些原因:vajesmc
觸覺反饋:許多人發(fā)現(xiàn)使用這些物理控件比在觸摸屏顯示器上瀏覽數(shù)字菜單更直觀。旋鈕和按鈕在被按下或轉(zhuǎn)動(dòng)時(shí)會(huì)提供物理反饋,這可以讓您更輕松地與控件進(jìn)行交互,而無需將視線從道路上移開。vajesmc
可見性:在某些情況下,旋鈕和按鈕在明亮的陽光下或其他具有挑戰(zhàn)性的光線條件下更容易看到和使用,因?yàn)樗鼈儾粫?huì)像觸摸屏顯示器那樣受到眩光或反射的影響。vajesmc
安全:使用物理旋鈕和按鈕比與觸摸屏顯示器交互更安全,因?yàn)樗试S駕駛員將手放在方向盤上,眼睛盯著路面。vajesmc
因此,在汽車的中央屏幕上安裝一個(gè)用戶友好、可靠且直觀的簡(jiǎn)化人機(jī)界面 (HMI) 至關(guān)重要,以便最大限度地減少駕駛員的學(xué)習(xí)曲線,并使他們能夠輕松高效地訪問所需的功能,而不會(huì)遇到任何錯(cuò)誤。其中最重要的是虛擬語音助手。vajesmc
當(dāng)今市場(chǎng)上有幾種流行的虛擬語音助手,如亞馬遜 Alexa、谷歌助手、蘋果 Siri、微軟小娜、三星 Bixby、百度度兒和小米小愛同學(xué)。此外,還有其他專為汽車行業(yè)設(shè)計(jì)的專有虛擬語音助手,如 Cerence、SoundHound Houndify、Harman Ignite 和 Nuance Dragon Drive。vajesmc
汽車行業(yè)中的大多數(shù)虛擬助手都是為了與車輛信息娛樂系統(tǒng)無縫集成,為駕駛員提供各種聲控功能,包括免提電話、天氣預(yù)報(bào)、音樂流和聲控導(dǎo)航。此外,它們旨在識(shí)別和響應(yīng)自然語言命令,使駕駛員能夠以更直觀、更輕松的方式與車輛互動(dòng)。通過提供一種安全便捷的方式與車輛進(jìn)行交互,這些虛擬語音助手可以讓駕駛員將手放在方向盤上,眼睛盯著路面。vajesmc
盡管近年來虛擬語音助手有了顯著改進(jìn),但仍有一些挑戰(zhàn)需要解決。以下是虛擬語音助手目前存在的一些常見問題:vajesmc
理解復(fù)雜命令:虛擬語音助手在理解涉及多個(gè)變量或條件的復(fù)雜命令或請(qǐng)求時(shí)可能會(huì)遇到困難。vajesmc
口音和方言:虛擬語音助手也可能難以理解具有不同口音或方言的用戶。vajesmc
背景噪音:虛擬語音助手可能對(duì)背景噪音很敏感,這會(huì)使他們難以理解用戶的命令或請(qǐng)求。vajesmc
隱私問題:隨著虛擬語音助手變得越來越普遍,人們?cè)絹碓綋?dān)心用戶數(shù)據(jù)的隱私。vajesmc
與其他汽車系統(tǒng)集成:虛擬語音助手可能難以與其他系統(tǒng)或設(shè)備集成,這可能會(huì)限制其功能和實(shí)用性。vajesmc
ChatGPT 可以說自然語言并像人類一樣交談,因?yàn)樗且环N語言模型,使用稱為 transformer 架構(gòu)的深度學(xué)習(xí)技術(shù)在大量文本數(shù)據(jù)上進(jìn)行了訓(xùn)練。在訓(xùn)練期間,ChatGPT 接觸了大量的自然語言文本數(shù)據(jù),例如書籍、文章和網(wǎng)頁。這使它能夠?qū)W習(xí)人類語言的模式和結(jié)構(gòu),包括語法、詞匯、句法和語境。vajesmc
與基礎(chǔ)廣泛的訓(xùn)練方法不同,自然語言訓(xùn)練(例如 ChatGPT 提供的訓(xùn)練)允許開發(fā)針對(duì)專門數(shù)據(jù)集進(jìn)行微調(diào)的模型,其中可能包括常用的車輛命令或一系列不同的民族口音。然后通過在大型未標(biāo)記數(shù)據(jù)語料庫上進(jìn)一步訓(xùn)練模型來微調(diào)模型,以提高其語言理解能力。vajesmc
下圖顯示了我們對(duì)智能語音控制在汽車中的應(yīng)用的預(yù)測(cè)。vajesmc
vajesmc
資料來源:2021-2030 年按自主程度劃分的全球汽車 ADAS/AD 傳感器預(yù)測(cè)vajesmc
總的來說,汽車自然語言語音對(duì)話助手的潛力是巨大的,隨著不斷的研究和開發(fā),我們可以期待在未來看到更先進(jìn)、更復(fù)雜的語音助手。開發(fā)一個(gè)成功的用于汽車的自然語言虛擬語音助手是一個(gè)復(fù)雜且耗時(shí)的過程,需要多次迭代訓(xùn)練和微調(diào)。vajesmc
由于開發(fā)需要大量的數(shù)據(jù)、計(jì)算資源和專業(yè)知識(shí),只有微軟、特斯拉、英偉達(dá)、高通、谷歌和百度等少數(shù)公司有資源承擔(dān)這項(xiàng)工作。這項(xiàng)技術(shù)的開發(fā)估計(jì)需要三到四年的時(shí)間。對(duì) 3 級(jí)以上車輛的需求將會(huì)增加。vajesmc
正如我們的報(bào)告“汽車原始設(shè)備制造商是否應(yīng)該進(jìn)入自動(dòng)駕駛芯片生產(chǎn)?”,汽車行業(yè)將面臨與電氣化和智能技術(shù)相關(guān)的障礙,需要持續(xù)的資本投資和半導(dǎo)體供應(yīng)商的支持。因此,只有少數(shù)具有相當(dāng)規(guī)模經(jīng)濟(jì)的老牌汽車制造商能夠?yàn)檫@些舉措提供資金。汽車中自然語音控制的日益普及只會(huì)加劇這些挑戰(zhàn)。vajesmc
責(zé)編:EditorTiger
閱讀全文,請(qǐng)先