捷通華聲:靈云人工智能開啟家電智能語音交互新時代
捷通華聲:靈云人工智能開啟家電智能語音交互新時代
物聯(lián)網(wǎng)時代,人工智能技術(shù)的融入尤其是語音交互技術(shù),給家庭交互、客廳娛樂等帶來無限可能。在當下的智能家居行業(yè),語音基于其交互的自然性,被認為是未來人與家居交互的主要入口路徑,業(yè)內(nèi)普遍認為,“語音將成為入口連接各種服務(wù),構(gòu)建智家生態(tài)”。
捷通華聲憑借在人工智能領(lǐng)域多年的積累,依托托國內(nèi)首個全方位人工智能開放平臺——靈云平臺,結(jié)合國內(nèi)領(lǐng)先的靈云遠場語音交互技術(shù),以及人臉識別、聲紋識別、指紋識別等技術(shù)全面賦能物聯(lián)網(wǎng),成功在智能電視、智能機頂盒、智能車載、智能音箱、智能機器人等眾多領(lǐng)域?qū)崿F(xiàn)落地應(yīng)用。
同時,行業(yè)解決方案已經(jīng)在業(yè)內(nèi)得到廣泛認可,成功應(yīng)用于新松、棠棣、木爺?shù)葞资曳?wù)型機器人中,以及長安等眾多智能車載產(chǎn)品中,并與樂視、小米等眾多電視、空調(diào)家電廠商建立了合作。
近日,捷通華聲總經(jīng)理武衛(wèi)東接受了媒體專題訪談,主要探討了以語音交互技術(shù)為核心的人工智能技術(shù)如何推動智能家電發(fā)展,并對AI與家電未來的深度結(jié)合進行了展望,以下為采訪整理稿。
請簡單介紹公司目前在人工智能領(lǐng)域的布局,尤其以語音識別、語音交互為技術(shù)核心的人工智能戰(zhàn)略。
通過構(gòu)建人工智能開放平臺的方式,深化行業(yè)應(yīng)用、聚集合作伙伴,進而構(gòu)建人工智能產(chǎn)業(yè)生態(tài)是捷通華聲重要的戰(zhàn)略布局。捷通華聲在這方面很早就進行了積極的探索,2011年,捷通華聲的靈云全方位人工智能開放平臺就面向產(chǎn)業(yè)全面開放,并以“云 + 端”方式,為產(chǎn)業(yè)界提供語音合成、自然語言理解、語音識別、麥克風陣列、語音喚醒、手寫識別、光學字符識別、人臉識別、聲紋識別、指紋識別、數(shù)據(jù)挖掘、機器翻譯等全方位人工智能能力。通過將其積累的人工智能技術(shù)開放出來,捷通華聲積累了眾多的合作伙伴,并服務(wù)大量的行業(yè)客戶。
以全方位人工智能技術(shù)為基石,捷通華聲已經(jīng)構(gòu)建了完善的人工智能云服務(wù)和產(chǎn)品生態(tài)系統(tǒng),從公有云、私有云到行業(yè)解決方案,全面賦能各行各業(yè),努力實現(xiàn)“讓每一家企業(yè)都擁有人工智能,讓每個人都能享受到人工智能的方便與快捷”的人工智能戰(zhàn)略。
目前,靈云人工智能云服務(wù)及產(chǎn)品生態(tài)系統(tǒng)包括以下五大類:
靈云云服務(wù)平臺(AICloud),包含語音云、圖像云、鎮(zhèn)客服云、智能外呼云等智能方案云服務(wù)以及智能語音、智能圖像等全方位AI技術(shù)云服務(wù);
智能物聯(lián)網(wǎng)(AIoT),包含智能電視語音助手、智能音箱語音助手、智能車載輸入法等,致力于讓每個智能終端“能聽會說、能思考會判斷”;
全方位人工智能能力平臺(AICP),為企業(yè)提供包括靈云智能語音、智能圖像、智能語義、生物特征識別等全能力私有云能力平臺,客戶可以靈活挑選、組合AI技術(shù),實現(xiàn)企業(yè)業(yè)務(wù)、應(yīng)用的智能化升級;
人工智能聯(lián)絡(luò)中心(AICC),包含全渠道智能客服系統(tǒng)、智能外呼系統(tǒng)、智能語音分析系統(tǒng)等在內(nèi)的,面向智能客戶服務(wù)中心的全方位人工智能門戶解決方案;
行業(yè)智能解決方案(AIIS),包括應(yīng)用于會議、司法、醫(yī)療領(lǐng)域的智能語音轉(zhuǎn)錄系統(tǒng),支持文本、名片、票據(jù)、證照識別的智能圖像識別系統(tǒng),以及可對人臉、聲紋等身份信息進行綜合認證的多維生物特征識別系統(tǒng)等。
在您看來人工智能目前處在怎樣的發(fā)展階段和什么樣的歷史位置?
目前,人工智能已經(jīng)處在了從技術(shù)快速發(fā)展到技術(shù)落地應(yīng)用的階段。例如經(jīng)過十幾年的發(fā)展,語音識別技術(shù)進入到自由說的狀態(tài):當人自然說話、自然表達時能夠準確識別,這推動語音識別進入到實現(xiàn)應(yīng)用的階段。捷通華聲將先進的語音交互技術(shù)成功應(yīng)用與智能客服、智能外呼機器人、智能電視語音助手等產(chǎn)品上就是典型案例。
但除卻語音和計算機視覺領(lǐng)域,人工智能技術(shù)在其它領(lǐng)域的“落地”卻并不盡如人意,拿不出一份接地氣的商業(yè)落地成績單。很多人工智能技術(shù)開發(fā)者技術(shù)很強,但面對復雜的商業(yè)應(yīng)用場景時便顯得有些捉襟見肘。“人工智能+行業(yè)”是人工智能落地的基礎(chǔ),它只有像水滴一樣滲透到實體經(jīng)濟中,滲透到各個行業(yè)中,才能帶來價值。
如今人工智能已如當年的互聯(lián)網(wǎng)一樣,成為整個時代的引領(lǐng)者,其應(yīng)用落地也會對各行各業(yè)帶來深遠影響。在未來的發(fā)展中,人工智能技術(shù)的發(fā)展還會有起伏,但不會再出現(xiàn)大的波瀾,它已然成為一項實用的技術(shù),正在各個領(lǐng)域進入實用階段,必然會對未來帶來巨大變革。
就AI技術(shù)的發(fā)展而言,目前和家電產(chǎn)品是怎么結(jié)合的?能給家電行業(yè)帶來哪些變化?
目前在家電產(chǎn)品上應(yīng)用最廣泛的還是語音交互相關(guān)的AI技術(shù),通過使用語音識別、語音合成、語義理解等技術(shù),使家庭中靜止的家居轉(zhuǎn)變?yōu)槟苈牽烧f會思考的智能設(shè)備,用戶通過簡單的語音交互便能實現(xiàn)家居設(shè)備的控制。
AI技術(shù)的發(fā)展,其實改變了傳統(tǒng)的以遙控器或手機APP進行人機交互的方式,給家電行業(yè)注入了新動能,并促使著整個家電行業(yè)進行轉(zhuǎn)型升級,以更加智能化、便捷化、人性化的方式為消費者提供服務(wù)。
在諸多有可能被AI技術(shù)顛覆的領(lǐng)域中,家電是否有被AI賦能的需求?貴公司又是如何給家電行業(yè)帶來變化和發(fā)展?
這個需求是肯定的,特別是物聯(lián)網(wǎng)技術(shù)的發(fā)展,我們正在進入到一個萬物互聯(lián)互通的時代。而與我們息息相關(guān)的家電等設(shè)備,作為一個個獨立的終端,由于傳統(tǒng)交互方式及功能的單一,亟需通過AI賦能來提升用戶體驗并提供額外的增值服務(wù)。
目前捷通華聲已經(jīng)在和各大家電廠商合作,通過輸出ASR(語音識別)、TTS(語音合成)、NLU(語義理解)等核心能力,為家電廠商提供產(chǎn)品智能化升級的技術(shù)保障。
提供核心技術(shù)的同時,捷通華聲也打造了智能電視語音助手、遠場機頂盒語音助手、智能音箱語音助手等各類語音交互產(chǎn)品,從核心技術(shù)到應(yīng)用產(chǎn)品全面賦能,從而實現(xiàn)讓每個智能終端“能聽會說、能思考會判斷”。
站在貴公司的角度,如何推動人工智能家電的發(fā)展?能為家電企業(yè)提供怎么樣的技術(shù)與解決方案?
捷通華聲擁有語音識別、語音合成、語義理解、麥克風陣列技術(shù)、圖像識別、人臉識別、聲紋識別等12項人工智能核心技術(shù),并在2011年率先推出了全球首個全方位人工智能開放平臺——靈云平臺,30多種人工智能技術(shù)SDK全部免費下載使用,為各行各業(yè)進行AI賦能。針對家電企業(yè),我們除了提供我們的語音、語義、人臉識別、聲紋識別相關(guān)的AI技術(shù)外,我們還提供智能機頂盒、智能音箱、智能家居等一整套的語音交互解決方案,并且已經(jīng)在一些項目中成功落地。
靈云智能終端解決方案的一大優(yōu)勢就是適應(yīng)性強、可復制性強,可根據(jù)客戶需要在不同設(shè)備中實現(xiàn)助手級的語音交互能力。例如靈云電視語音助手可快速嵌入到電視、機頂盒、廣電盒子等設(shè)備中,通過藍牙遙控器直接語音控制電視,或利用麥克陣列,直接與電視對話,輕松實現(xiàn)語音搜索、設(shè)備控制、天氣查詢等功能。助手級解決方案同樣可以應(yīng)用于機頂盒廠商、OTT盒子、IPTV盒子等電視盒子中,讓盒子也能快速擁有語音交互能力。
貴公司目前是否和家電企業(yè)建立合作,哪些家電品類對AI技術(shù)需求更迫切?您認為哪些家電需要AI技術(shù)的加持和賦能。
捷通華聲一直和家電企業(yè)保持有密切合作,在家電品類上,例如電視、冰箱、空調(diào)等大家電及微波爐、燈具、掃地機器人等小家電都有智能化升級的需求和必要,通過結(jié)合語音識別、圖像識別等AI技術(shù),賦予家電新的交互方式,例如可以邊看電視邊通過圖像識別下單購物,空調(diào)可以根據(jù)室內(nèi)溫度及用戶習慣自動調(diào)節(jié),冰箱可以根據(jù)已有食材為你搭配菜譜等等,總之,有了AI技術(shù)的加持,家電會變得越來越“懂你”。
在AI技術(shù)具體落地方面,主要有哪些?是大數(shù)據(jù)的分析、云計算,還是主要指交互方式的變化?
這幾方面應(yīng)該都有。AI技術(shù)的發(fā)展一方面的確會改變傳統(tǒng)的交互方式,比如傳統(tǒng)家電的按鍵到遙控器模式,再到手機APP控制形式,再到最近比較流行的語音交互形式,將來還可能會出現(xiàn)腦電波控制家電的場景;另一方面,通過與大數(shù)據(jù)、云計算技術(shù)的結(jié)合,人工智能還能夠根據(jù)用戶行為歸納預測并智能推薦個性化服務(wù),例如,冰箱的雞蛋快吃完時,它能夠主動發(fā)出提醒并完成下單;每天回家前一個小時,空調(diào)就會自動啟動,并調(diào)至主人習慣的溫度等等。
AI技術(shù)在實現(xiàn)過程中的難點主要是哪個方面?
AI技術(shù)的發(fā)展其實是螺旋上升的一個過程,它并不完美,想要達到人們期望的效果其實是有一定難度的,一些人類簡單的操作如看和聽,對于機器來說并不容易,而且讓機器能夠像人類一樣思考更是難上加難,這也是AI技術(shù)在實際落地中面臨的最大挑戰(zhàn)。
目前來看,您如何看待,人工智能對家電的影響主要體現(xiàn)在交互方式的變化,語音、圖像以及手勢識別?未來還會有哪些變化?除了交互方式,還有哪些是AI能帶給家電的?
目前,人工智能主要改變的是家電的交互方式,用戶通過語音、圖像、手勢等操作方式更自然地與設(shè)備進行交互,但這其實仍然依賴人去操控,而未來智能家電會根據(jù)用戶行為分析,主動去提供一些個性化服務(wù)。
除了交互方式外,AI將來甚至會改變家電的形態(tài),例如電視機將不會再有實體設(shè)備,而是一個虛擬的立體投影,除了看電視,還兼具家庭管家、視頻聊天、智能陪護等功能
在交互方式變化的背后,有哪些革命性技術(shù)?作為人工智能技術(shù)解決方案商,貴公司能給家電企業(yè)帶來什么?
交互方式的改變,離不開語音識別、語義理解、圖像識別等人工智能核心技術(shù),而這些技術(shù)的發(fā)展其實離不開深度學習技術(shù)所帶來的革命性突破。捷通華聲依托與清華大學建立戰(zhàn)略合作,擁有一大批人工智能的核心算法研究團隊,目前公司所推出的12項人工智能技術(shù)均為捷通華聲完全自主知識產(chǎn)權(quán),全方位的開放平臺為家電企業(yè)變革創(chuàng)新帶來了新的契機。
伴隨全屋智能發(fā)展起來的還有智能音箱這一新品類,您認為在未來智能音箱在AI鏈條中的地位是怎樣的?
智能音箱其實目前更多是起到一個教育用戶認知人工智能的作用,相較于國外流行的音樂文化,國內(nèi)的大多數(shù)用戶并沒有在家庭中使用音箱(或音響)的習慣,而目前智能音箱的火爆,其實是人們對語音交互及智能問答等功能的好奇“嘗鮮”,而在未來,智能音箱很可能會演變?yōu)榧彝サ闹悄苷Z音助手,但是,無論未來語音助手演化成何種形態(tài),都不會僅僅局限于現(xiàn)有的音箱模式之中。
目前AI交互技術(shù)存在的問題是哪些?不完美的地方有哪些?距離真正的智能還有多遠?
AI技術(shù)存在的問題是目前并不完美,離人們的期望還存在一定差距。例如人臉識別、聲紋識別等身份認證技術(shù),雖然已經(jīng)達到了很高的識別準確率,但由于應(yīng)用場景的特殊性,千萬分之一的錯誤都可能帶來嚴重的后果。
另外由于目前NLU技術(shù)(語義理解)的發(fā)展瓶頸,市面上大多數(shù)的智能化產(chǎn)品其實并不太智能,依然需要人為主動地進行操控??傊?,距離真正的智能還有很遠的路要走。
您能描述一下,AI家電的使用場景和終極發(fā)展階段的樣貌。
在未來,所有的家電將會互聯(lián)互通,除了與人交互外,設(shè)備間也能進行“溝通”,家電通過學習用戶行為,能夠在無感知無指令的情況下為人們提供適時適宜的服務(wù)并且不會產(chǎn)生打擾。另外,家電設(shè)備的形態(tài)也可能會發(fā)生變化,人們將會體驗到真正智能化、便捷化、人性化的家居服務(wù)。
評論:
目前沒有評論內(nèi)容。