目前,奪戰(zhàn)基于人工智能技術(shù)的硬件語音識別和圖像識別已經(jīng)達到了較為成熟的階段。據(jù)白皮書介紹,目前國際領(lǐng)先企業(yè)圖像分類的錯誤率已降至3.0%,人臉識別率達到99%左右,語音識別的錯誤率下降到5%左右,百度公司的錯誤率僅為3.7%,并且在方言識別方面也具有優(yōu)勢。圖像識別和語音識別技術(shù)的發(fā)展給人機交互模式創(chuàng)造了新的可能,在無法使用鍵盤輸入或者雙手被占用的情況下,語音輸入將為設(shè)備控制提供新的可能,例如在家電、汽車、無人機、快遞分揀、機器人等領(lǐng)域,人工智能將成為強大的功能引擎。
2017年,隨著人工智能和硬件技術(shù)的發(fā)展,企業(yè)開始走向細分市場的打磨,推出許多特定場景下的產(chǎn)品,突出智能硬件的核心功能和價值,最明顯的領(lǐng)域是在家庭消費市場中,出現(xiàn)了多種智能硬件并存、取長補短、相互配合、協(xié)調(diào)發(fā)展的局面,例如智能電視、智能音箱、智能家電、智能攝像頭的普及和運用。

天貓精靈
對于這一現(xiàn)象,白皮書中也有進一步解釋和說明。人類對電子設(shè)備的可視時長是有限的,PC與電視每天消耗了7-8個小時,手機占用了碎片化時間,額外創(chuàng)造出3-4個小時,3者相加已接近人類娛樂時間的峰值,若新一代智能硬件依舊依托于可視經(jīng)濟,則必然會受到時長的制約,這也是制約VR設(shè)備成為新一代家庭娛樂終端的重要原因。因此,語音功能的成熟為新一代智能硬件提供了“無屏化/弱屏化”的發(fā)展模式,不再以人類視覺為注意力核心,在有限的時間內(nèi)進一步加身人類與互聯(lián)網(wǎng)的融合程度,實現(xiàn)多路徑、多渠道的信息傳播和獲得。
當然,面對智能硬件的多元化趨勢,也對核心技術(shù)提出了更高要求。例如,云端協(xié)同的計算能力、新架構(gòu)新器件的加速運用、終端芯片的異構(gòu)計算能力、軟硬件的深度融合等等。此外,計算機視覺技術(shù)雖然取得了長足進步,但對于今后來說,計算機視覺技術(shù)還應(yīng)突破“看懂”能力;同樣,自然語言處理技術(shù)的“聽懂”能力也十分重要,通過新的交互模式產(chǎn)生新的碰撞,為人類生活帶來新的生機。
對于智能家居產(chǎn)品的天然優(yōu)勢,白皮書認為,智能音箱作為控制中心有3個天然優(yōu)勢,包括成本較低、適合引入語音技術(shù)、智能語音芯片和語音處理算法能進一步提高智能音箱的應(yīng)用能力等。甚至有部分芯片企業(yè)和語音技術(shù)企業(yè)合作,將麥克風陣列和遠場語音識別等功能集成為芯片模組,方便智能音箱企業(yè)使用。此外,智能音箱企業(yè)也正在逐步加深與家電行業(yè)的合作,實現(xiàn)無縫接入和集中控制。
總之,以語音交互、自動控制功能為主的家居硬件創(chuàng)新將逐步增多,控制型硬件從環(huán)境感知類設(shè)備向語音控制類設(shè)備轉(zhuǎn)移,圍繞智能音箱、智能語音為核心的新型智能家居應(yīng)用生態(tài)開始逐步建立起來,智能家居的入口爭奪戰(zhàn)將越來越激烈。
*部分參考資料來源于《智能硬件產(chǎn)業(yè)發(fā)展白皮書(2017)》(中國信息通信研究院發(fā)布)
作者:時尚




.gif)
.gif)
.gif)
.gif)
.gif)
.gif)
.gif)
.gif)
.gif)
.gif)



