外國的Siri都沒戲 中國的Siri們怎麼辦?
時間:時間: 2013-09-12 09:50:39 閱讀: 次 分類:APP開發
文/顧曉波
“外國的Siri都沒戲了,還中國的Siri呢。”在去年壹場語音技術大會上,壹位業內大佬私下對記者說,說完後就開始上臺鼓吹語音助手的未來。
在業界大佬和投資人們的吹捧下,語音應用的大餅被越畫越大,2012年隨著Siri支持中文,又壹波創業者投身其中,各家迫不及待地通過各種演示來證明自己可以秒殺Siri。
然而兩年過去了,在很多智能語音應用上,被放在第壹位的功能仍然是“打電話給張三”、“發短信給李四”等,諷刺的是語音撥號在2000年推出的3310上就已經被支持,除了語音識別率的數字不斷升高,語音助手卻並沒有實質性的進步。
“這是壹場持久戰。”科大訊飛移動互聯事業部副總經理章繼東說,“未來語音應用壹定會成為剛需,但是產品形態比起現在肯定會有很大的改變。”
所有語音助手總用戶量僅5000萬
易觀智庫今年5月發布的數據顯示,2013年5月語音助手類應用累積下載量排行中,沖動語音助手以29.8%占比第壹,其次是智能360占25.2%,而科大訊飛旗下的訊飛語點由於靈犀的分流,排名第三,占到20.1%。
蟲洞語音助手創始團隊成員王向壹透露,目前蟲洞語音助手總用戶為1600萬,月活躍用戶在百萬左右,按照易觀智庫的比例計算,國內所有語音助手總每月下載量僅為4442萬,用戶量總和僅5000萬,活躍用戶330多萬,對目前大多數APP來說,300多萬的月活躍都不是壹個拿得出手的數字。
想找語音助手的問題太容易,微博、應用商店的評論中,對流量、識別率、理解能力的抱怨比比皆是,盡管語音技術的領頭羊科大訊飛已經把語音識別率做到了95%,但是對語音助手而言識別僅僅是開始。
“語音交互的錯誤會傳遞,比如語音識別的準確率在85%到95%之間,語義分析的準確率在85%到95%之間,那麼最後的準確率就會降到70%-90%。”語音技術提供商思必馳首席科學家、劍橋大學語音識別技術研究院俞凱說。
對多數用戶而言,在使用語音助手之前,就已經承擔了這10%到30%的出錯風險,而這壹風險再和結果的準確性疊加,準確達到目的的概率就更低。
不過這並不是語音助手們的錯,要通過語音助手完成壹個任務,要經過語音識別、語義解析、行動選擇、任務處理、語音合成等多個環節,其中語義解析涉及復雜的自然語言處理,任務處理又涉及到搜索和大數據等技術。
目前各家各有所長,百度擅長大數據,訊飛擅長語音識別,蟲洞擅長自然語言處理,但是沒有壹個公司能夠將所有環節都做到萬無壹失,而其中任何壹個環節的缺失,都會給語音助手的體驗和效率大打折扣。
人工智能理想 vs 人機交互現實
“聰明的讓人難以置信”、“全能語音助手”、“比Siri更懂中文”、“深度神經網絡”等玄之又玄的描述壹再出現在各類語音助手的介紹中,這使得這些軟件看上去似乎無所不能,而這也給了用戶過高的預期,軟件開發商們希望通過誇張的描述吸引用戶,卻使自己陷入了另壹種尷尬——語音助手給了用戶壹個人工智能的理想,而現實中,它只是壹個人機交互工具。
“清晨,手機像仆人壹樣輕聲說:‘主人,該起床了,今天是周五,早上要開例會,別忘了帶會議報告哦。’用戶隨即問:‘今天路況如何?’手機回復:‘今天您的車限行,您可以坐地鐵十號線直接到公司,保證不遲到。’”俞凱這樣描繪下壹代的語音交互技術。
俞凱介紹,思必馳已經通過上下文分析實現了多輪交互,也就是可以識別用戶追問的問題,比如用戶說“搜索附近酒店”,得到結果後追問“我要三星級的”,語音助手便可在之前的搜索結果之上進行進壹步篩選,俞凱表示,語音交互的不確定性可以在多輪交互中有效消除。
而另壹家語音技術公司相關負責人表示,這種方式可以針對某些特定場景實現,比如訂酒店、查機票等,但是與真正的智能語音仍有距離。
智能360語音助手創始人李傳豐表示,如果真的實現,那已經是人工智能,而非簡單的人機交互了。
自然語言的解析能力是人機交互與人工智能之間的鴻溝,人類的語言復雜程度超出了機器的理解範圍,這給基於語音的任務處理帶來了很大的麻煩,記者用訊飛語點測試“附近有什麼餐館”時,系統給出了大眾點評的附近餐館搜索結果,而對系統說“附近有什麼便宜的餐館”、“附近有什麼高檔餐廳”時,給出的結果與第壹次壹樣。語音軟件並不能真正理解用戶的需求。
這壹問題並不僅僅存在於國內語音助手,俞凱介紹,目前Siri的四個語音技術部門中有壹個研究語音的輸入輸出,四個負責自然語言處理。
“可能大家對語音助手這類產品寄托了太多情感和期望,但這實際上是不合適的。”李傳豐說,“人工智能時代很美好,但理性的講,來的不會太容易,而且並不是單靠語音助手就可以實現。”
而章繼東表示,通過上下文解析來提升識別能力並不是不可行,但是這並不是目前的重點,語音助手的搜索結果需要健全的第三方生態去支撐,但是現在無論是用戶市場還是第三方生態都不夠成熟。
馬拉松式競爭 試水穿戴設備與O2O
“我們找了很多投資人,但是他們都說已經不看這壹類的項目了。”壹位語音助手的創業者說。
資本的駛離讓這壹場競爭顯得更加漫長而殘酷,蘋果對Siri類軟件的排斥則是雪上加霜,訊飛語點和靈犀在經過長達半年的審核,閹割掉諸多功能後才勉強在App Store上架。
章繼東表示,這是壹場馬拉松式的競爭。
事實上有不少“選手”已經中途推出,此前宣稱要做中文版Siri的Airi已經將近壹年沒有更新,小i機器人轉向B2B市場,搜狗語音助手在經歷了壹波大規模推廣後逐漸淡去。
幸存者們則在技術和市場的漫長煎熬中摸索著方向,訊飛語點、蟲洞語音助手和智能360都已經通過接入第三方O2O服務進行分成獲得壹些收入,李傳豐表示,目前智能360的重心在酒店、機票、餐飲等領域,未來語音技術肯定會在細分領域爆發。
不過李傳豐也坦言,O2O也受到技術的制約,比如訂酒店,由於涉及到地名和各種數據,語義解析難度很大。
另壹方面智能穿戴設備也給語音助手創造了新的生存空間,章繼東表示,智能穿戴設備上的用戶需求比智能手機上窄得多,大多集中在打電話、發信息以及輸入等功能上,目前的智能語音水平足夠滿足穿戴設備的需求。
對語音助手類軟件而言,價值取決於其能夠提供的服務,百度、搜狗等擁有大數據和搜索技術的公司加入補上了這類軟件的最後壹環,在技術瓶頸難以突破的情況下,加速了這類軟件從技術導向互聯網服務導向的轉型,正如章繼東所說,未來語音助手的產品形態肯定不是現在的樣子,對正在苦苦煎熬的創業者來說,能撐下去,就有出頭之日。
網易科技訊 6月28日消息,據臺灣媒體報道,鴻海精密近日在股東大會上展示了其研發的壹...