天貓魔盒新品發(fā)布,聲智科技帶你揭秘機頂盒背后的語音交互邏輯5月27日晚,深圳衛(wèi)視的《超級發(fā)布會》直播現(xiàn)場迎來了天貓精靈“炫AI生活”的主題發(fā)布會。除了戚薇、王錚亮等一眾明星的星光熠熠,會上發(fā)布的智能機頂盒產(chǎn)品“天貓魔盒”更奪人眼球。 發(fā)布會上,戚薇吃掉了“遙控器”,天貓魔盒更厲害,吃掉了所有的遙控器,動動嘴,科技生活,開口即來。
圖為天貓魔盒發(fā)布會現(xiàn)場 作為阿里天貓精靈背后的語音交互技術(shù)提供商,今天聲智科技就帶您一起揭秘“智能機頂盒”產(chǎn)品背后的語音交互邏輯。 準備好了嗎?你家的機頂盒要升級了! “人工智能語音點播”這個概念在機頂盒市場已經(jīng)不新鮮了,無論是網(wǎng)絡(luò)機頂盒,還是4K高清電視機頂盒。然而,各家玩轉(zhuǎn)的概念還是離不開“遙控器”。 遙控器控制語音點播一直是不少用戶吐槽的槽點: “為什么不能直接語音點播?” “如果我都已經(jīng)拿到遙控器,我一鍵就可以看我的歐冠決賽,干嘛還要蛋疼的說一句,然后默默等待...” 用戶對于更自然的人機交互方式的真實追求,成為了機頂盒智能化升級源源不斷的動力。機頂盒遠場語音交互的能力提升也是源于語音智能服務(wù)落地并向智慧家庭邁進的進一步訴求。畢竟,以遙控器為代表的傳統(tǒng)智能電視交互方式承載能力有限,而遠場語音控制不但讓人與電視的交互變得更加簡單自然,還可以更大釋放智能電視的操作空間。 如何快速實現(xiàn)智能機頂盒一站式升級? 如何牢牢把握住語音交互時代的機遇,快速實現(xiàn)電視機頂盒一站式升級?下面,專注聲學前沿技術(shù)和人工智能交互的“聲智科技”就帶您一探究竟智能機頂盒升級,那些不可不說的秘密武器。 1.麥克風陣列 電視作為大尺寸顯示設(shè)備,用戶的使用距離較遠,而且客廳的環(huán)境較復雜,并且機頂盒是距離電視最近的外置設(shè)備,電視播放過程中的聲音也會對機頂盒造成不小的影響,因此實現(xiàn)天貓魔盒的“釋放雙手,炫AI生活”自然離不開遠場語音交互技術(shù),而提到遠場語音交互技術(shù)首先提到的一定是麥克風陣列技術(shù)。 麥克風陣列的主要作用是幫助機器適應(yīng)更加復雜的場景,擺脫遙控器的局限,也就是不再是用戶去適應(yīng)設(shè)備,而是機器來配合人類的交互習慣。這其中,麥克風陣列起到了關(guān)鍵性作用。 麥克風陣列是由一定數(shù)目的聲學傳感器組成,用來對聲場的空間特性進行采樣并處理的系統(tǒng),通常麥克風陣包含2個以上的麥克風。此次,新款天貓魔盒搭載的就是6麥環(huán)型陣列。 ![]() 圖為聲智科技麥克風陣列模組 麥克風陣列的關(guān)鍵技術(shù)包含了通話降噪、混響抑制、回聲抵消、噪聲抑制、語音增強、波束形成、增益控制、識別優(yōu)化等。 目前,聲智科技為智能機頂盒市場打造了定制優(yōu)化的低功耗麥克風陣列芯片,并針對客戶的智能電視、智能機頂盒等產(chǎn)品的不同市場定位推出了量產(chǎn)驗證且成本可控的2麥、3麥、4麥、6麥,線型、環(huán)型、菱型等陣型的麥克風陣列模組,幫助用戶快速升級產(chǎn)品,量產(chǎn)落地。 2.機頂盒專屬遠場語音喚醒、識別等技術(shù) 與智能音箱不同的是,智能音箱是一款單品,無需適配其他第三方硬件產(chǎn)品,單一的音頻信號,簡單、清晰的交互邏輯。但是機頂盒產(chǎn)品不僅增加了視頻播放的功能,還需要適配不同品牌、不同機型的電視,而且多維度的交互場景使得語音交互過程復雜、多變,技術(shù)難度系數(shù)更大。 聲智科技推出的SoundAI Voice Kit(以下簡稱SVK)針對智能機頂盒產(chǎn)品使用場景定制了以O(shè)penAEC技術(shù)、VAN技術(shù)為代表的專屬技術(shù)。 SVK是一款集成聲波配網(wǎng)、波束形成、聲源測向、定向拾音、噪聲抑制、混響消除、回聲消除、語音喚醒、端點檢測、語音識別、語義理解、語音合成、雙工通話等全鏈路的智能語音交互開發(fā)套件,兼容主流智能語音硬件架構(gòu),支持DuerOS、AliGenies、小愛平臺、騰訊叮當、Amazon Alexa等主流AI平臺, 助力品牌廠商實現(xiàn)智能硬件產(chǎn)品的極速開發(fā)和量產(chǎn)上市。 ![]() 圖為聲智科技SVK介紹 OpenAEC技術(shù)主要解決弱參考信號或者無參考信號等更為復雜場景的回聲抵消(自噪聲抑制)問題,是SVK針對智能機頂盒產(chǎn)品的交互特點而推出的。一款智能音箱上市,其喇叭的參數(shù)及特性,以及智能音箱輸出的音頻參考信號是已知且較為準確的,工程師可以針對其特點,有的放矢的進行自噪聲抑制和遠場信號處理,從而實現(xiàn)很好的遠場語音交互體驗效果。 ![]() 圖為智能音箱與智能機頂盒場景對比 但智能機頂盒需要匹配不同品牌、機型的電視產(chǎn)品。而眾多品牌、機型的電視機其喇叭參數(shù)特性千差萬別,不僅如此,電視機廠商打造的絢爛音效,如立體聲、環(huán)繞聲等,也為智能機頂盒的信號處理帶來了極大的阻礙,加上電視機回傳給機頂盒的音頻參考信號的不準確性,使得機頂盒的自噪聲抑制和遠場信號處理的難度急劇增加。聲智科技通過創(chuàng)新性的OpengAEC技術(shù)獨辟蹊徑,大幅提升遠場語音喚醒的準確率,實現(xiàn)全方向的精準喚醒,并減少無序喚醒干擾,兼顧誤喚醒率。 除此之外,SVK針對智能機頂盒產(chǎn)品,推出了抗強噪喚醒技術(shù)(AKS技術(shù))、垂直抗強噪識別技術(shù)(VAN技術(shù))、空間感知技術(shù)(SSP)和空間認知技術(shù)(SSA)等,其中的VAN技術(shù)也是智能機頂盒場景不可或缺的獨特技術(shù)。 常見的居家環(huán)境下,電視一般掛在墻上,智能機頂盒放置在電視旁邊或者前方。這時候噪聲源、語音源與智能機頂盒的位置很特別,智能機頂盒的麥克風陣列距離電視喇叭發(fā)出的噪音源很近,當電視音量很大的時候,保證智能機頂盒的識別精準度就非常困難。針對這樣的交互情況,聲智科技推出了垂直抗強噪識別技術(shù),專門匹配相應(yīng)場景,為您帶來更出色的遠場交互體驗。 聲智科技結(jié)合國內(nèi)智能機頂盒的發(fā)展趨勢和用戶需求,顛覆了傳統(tǒng)機頂盒的交互方式,真正實現(xiàn)了人機之間的自然語音交互服務(wù)。在領(lǐng)先的麥克風陣列、喚醒、識別等技術(shù)之上,配合96%以上準確率的垂直領(lǐng)域深度語義解析以及行業(yè)領(lǐng)先的多輪交互能力、服務(wù)穩(wěn)定性維持在99.9%以上,使用戶可以拋開遙控器,自由體驗AI炫生活。 多場景,全覆蓋,體驗豐富的語音交互未來 機頂盒從單一功能逐步發(fā)展成一種“復合型”產(chǎn)品,聲智科技可以幫助機頂盒產(chǎn)品擴展更多功能,比如點播節(jié)目、播放音樂、查詢天氣、控制播放、搜索信息等,實現(xiàn)從內(nèi)容、控制、游戲、服務(wù)的全覆蓋,豐富用戶的使用體驗。 游戲娛樂是智能機頂盒最直接也最多頻次的需求,聲智科技的SVK可以賦予產(chǎn)品放音樂、聽故事、講笑話、播新聞、玩游戲的功能,另外還針對兒童的需求比如成語解釋、兒童算術(shù)、唐詩宋詞等需求進行了豐富完善。 服務(wù)和控制功能使得機頂盒成為家庭各終端的交匯點,成為智能家居的重要入口。用戶可以語音詢問機頂盒百科內(nèi)容、找手機、設(shè)鬧鐘、查熱量、充話費、查快遞等,還可以控制家電等。 作為國內(nèi)服務(wù)用戶最多、應(yīng)用場景最全和覆蓋地域最廣的遠場語音交互技術(shù)供應(yīng)商。聲智科技一直以來致力于為廣播電視行業(yè)產(chǎn)業(yè)鏈提供便捷、可靠的技術(shù)服務(wù),為用戶帶去全新語音交互體驗。 (免責聲明:此文內(nèi)容為本網(wǎng)站刊發(fā)或轉(zhuǎn)載企業(yè)宣傳資訊,僅代表作者個人觀點,與本網(wǎng)無關(guān)。僅供讀者參考,并請自行核實相關(guān)內(nèi)容。) (責任編輯:海諾) |