天天快看點(diǎn)丨語(yǔ)音交互 + 大模型,更擬人的車機(jī)交互何時(shí)出現(xiàn)?
    2023-06-29 20:20:53 來(lái)源: ZAKER科技

    在 FF 91 2.0 的發(fā)布會(huì)上,我們看到了這樣一段語(yǔ)音交互。

    " 幫我在 Malibu 找一家有戶外座位且評(píng)價(jià)至少 4 星的意大利餐廳,不要披薩店。"這段語(yǔ)音中包含了 5 個(gè)具體的指令和明確的篩選項(xiàng),且沒(méi)有喚醒詞,系統(tǒng)隨后也給出了對(duì)應(yīng)選項(xiàng)。

    不論真假,出于好奇,AutoLab 在發(fā)布會(huì)第二天,以相同的條件隨機(jī)測(cè)試部分造車新勢(shì)力車型的語(yǔ)音交互能力,結(jié)果均未能完成。

    除此之外,視頻的重點(diǎn)在于指令更加符合人與人之間的交流邏輯,這也意味著它足夠擬人。而實(shí)現(xiàn)這套擬人化語(yǔ)音助手背后的推手,就是賽輪思。


    (資料圖)

    行業(yè)數(shù)據(jù)顯示,2022 年中國(guó)國(guó)內(nèi)車載語(yǔ)音市場(chǎng)集中度相當(dāng)之高,僅賽輪思和科大訊飛兩家,占比已經(jīng)超過(guò) 70%??拼笥嶏w大家都很熟悉了,在國(guó)內(nèi)合作的主機(jī)廠也很多。

    而另外一家賽輪思,想必絕大部分觀眾都未曾聽(tīng)說(shuō),其實(shí)蘋果的 "Siri" 就是由賽輪思和蘋果共同開(kāi)發(fā)的產(chǎn)品。除此之外,賽輪思的服務(wù)對(duì)象除了國(guó)內(nèi)外的主機(jī)廠商和 Tier 1 之外,還包含了像英偉達(dá),蘋果這類的科技巨頭。

    如何看待語(yǔ)音交互未來(lái)發(fā)展方向,賽輪思又如何應(yīng)對(duì)接下來(lái)行業(yè)挑戰(zhàn)。AutoLab 借賽輪思首席執(zhí)行官 Stefan Ortmanns 博士這次來(lái)中國(guó),在采訪中得到了一些答案。

    當(dāng)前語(yǔ)音交互最大的應(yīng)用場(chǎng)景是基于用戶給出的需求,系統(tǒng)做出對(duì)應(yīng)的指令。也就是一問(wèn)一答,通過(guò)還要伴隨著固定的喚醒詞匯。此前,在理想家庭科技日上,我們看到了大模型運(yùn)用在語(yǔ)音交互端的實(shí)力,可以出口成章,制定旅行計(jì)劃,更清晰的理解詞義。

    但隨著我們看到大模型的泛化能力和 AI 技術(shù)的不斷提升,用戶對(duì)于語(yǔ)音交互的要求也會(huì)更高。除了更擬人的交流方式,用戶更希望語(yǔ)音助手可以知道自己想要做什么,了解周圍發(fā)生的情況后,進(jìn)行智能主動(dòng)的推薦。

    比如說(shuō)電量不足時(shí),會(huì)自動(dòng)提醒附近的充電站,給出導(dǎo)航指引。又或者接電話時(shí),主動(dòng)關(guān)閉車窗,降低音量等。

    通俗而言,就是系統(tǒng)知道你想要做什么,明白你需要什么,而且還沒(méi)等你問(wèn)就告訴你要什么,也就是從被動(dòng)到主動(dòng)的過(guò)程。當(dāng)然,更簡(jiǎn)單的詞匯就是 " 心有靈犀一點(diǎn)通 "。

    賽輪思針對(duì)這樣的場(chǎng)景需求,推出 Cerence Proactive AI(PAI) 智能主動(dòng)推薦功能,語(yǔ)音助理可以按場(chǎng)景主動(dòng)向駕駛者進(jìn)行智能推薦 / 提醒和主動(dòng)通知,包括駕駛安全、路線規(guī)劃、情感交互和生活便利等等。

    這些與出行相關(guān)的信息,將對(duì)優(yōu)化出行體驗(yàn)起到關(guān)鍵作用。例如,在不安全駕駛情況發(fā)生前提醒用戶:更改駕駛模式、疲勞預(yù)警或預(yù)報(bào)極端天氣,這些均有助于提升駕駛安全,并實(shí)現(xiàn)更加先進(jìn)的語(yǔ)音座艙體驗(yàn)。

    當(dāng)然,這里要指出,并不是所有人都會(huì)接受這樣的語(yǔ)音交互方式,也會(huì)有不少伙伴會(huì)覺(jué)得聒噪。比如針對(duì)導(dǎo)航播報(bào),大部分車型都可以實(shí)現(xiàn)詳細(xì)播報(bào)或簡(jiǎn)潔播報(bào)的形式,甚至直接關(guān)閉語(yǔ)音提醒。

    同理,Cerence Proactive AI(PAI)基于語(yǔ)言大模型的實(shí)力,可以學(xué)習(xí)并識(shí)別用戶的個(gè)人偏好,習(xí)慣及反映,并且結(jié)合數(shù)據(jù)反饋,從而讓你的語(yǔ)音助手處在你的舒適區(qū)內(nèi)。

    具有主動(dòng)服務(wù)能力的語(yǔ)音助手,是 Cerence Co-Pilot AI 虛擬副駕駛解決方案的核心功能。

    有了主動(dòng)式的交流方式,自然也不需要固定的喚醒詞匯,尤其是在車內(nèi)多人的情況下。每人一句 "Hey,XX" 難免顯得過(guò)于笨拙。針對(duì)這一點(diǎn),賽輪思推出了 Cerence Just Talk,它會(huì)識(shí)別你所說(shuō)的話,并且是明確的指令或問(wèn)題時(shí),才會(huì)給到回應(yīng)。

    同時(shí)根據(jù)用戶說(shuō)話的方式以及關(guān)連對(duì)話的上下文,知道何時(shí)被召喚,從而提供一個(gè)更直觀的、像真人般的交互體驗(yàn)。

    舉個(gè)例子,你可以直接說(shuō)導(dǎo)航到東方明珠,我要去 XX 飯店,系統(tǒng)接收到明確指令后,就可以執(zhí)行相應(yīng)任務(wù)。

    這一點(diǎn)當(dāng)前不少車機(jī)都能做到,如蔚來(lái),問(wèn)界,哪吒等車型,均可以實(shí)現(xiàn)無(wú)喚醒詞。但 Just Talk 更進(jìn)一步,還能讓喚醒詞在語(yǔ)音指令不同的位置中,也能得到識(shí)別。

    現(xiàn)階段假設(shè)我們命名車機(jī)名稱為 " 老默 ",通常有效的指令是,你好老默,我想吃魚(yú)了。但調(diào)整順序或者改變喚醒詞,比如 " 我想吃魚(yú),老默。" 系統(tǒng)都很難回應(yīng)識(shí)別。但在 Just Talk 當(dāng)中,你可以說(shuō):

    " 老默,我想吃魚(yú)了。" 或者是 " 我想吃魚(yú)了,老默。"

    系統(tǒng)都可以給出相應(yīng)指令。而這個(gè)功能,很快我們就能在奔馳的全新 E 級(jí)上搭載的 MBUX 車機(jī)系統(tǒng)上,得到體驗(yàn)。屆時(shí),AutoLab 也會(huì)持續(xù)關(guān)注,給大家匯報(bào)下實(shí)機(jī)體驗(yàn)。

    除此之外,在采訪當(dāng)中,我們還看到了賽輪思在不同出行領(lǐng)域的語(yǔ)音交互方案。

    比如針對(duì)兩輪車戶外出行的語(yǔ)音識(shí)別需求,要克服噪音,識(shí)別正確的聲源;在不方便開(kāi)窗的前提下,實(shí)現(xiàn)和車外人的語(yǔ)音交流;甚至根據(jù)用戶情緒的變化,優(yōu)先推薦更快捷的路徑指引等等。

    Stefan Ortmanns 博士還特意舉例,以 Cerence Co-Pilot 為例,在現(xiàn)有成熟平臺(tái)的前提下,賽輪思的中國(guó)團(tuán)隊(duì)只需要不到一周的時(shí)間就可以實(shí)現(xiàn)最終 SOP。即使是從未合作的平臺(tái),最快六個(gè)月即可實(shí)現(xiàn)。歐洲技術(shù)配合中國(guó)速度,做到及時(shí)響應(yīng)。

    總結(jié)

    新能源市場(chǎng)競(jìng)爭(zhēng)進(jìn)入了下半場(chǎng)的智能化挑戰(zhàn),一個(gè)好用的,聰明的,擬人的車機(jī)交互絕對(duì)是用戶體驗(yàn)的重點(diǎn),也更容易被感知到。賽輪思和它的合作伙伴們,還能在語(yǔ)音交互上給我們帶來(lái)哪些更打動(dòng)人的細(xì)節(jié),我們拭目以待。

    END

    關(guān)鍵詞:
    責(zé)任編輯: 梅長(zhǎng)蘇