百度語音搜索開放日:百度說準備消滅鍵盤輸入
3月22日,百度舉行了首期語音搜索開放日活動,向媒體展示自己正在蓄力的最新技術應用——語音搜索。百度公司技術副總裁王海峰現場介紹了百度語音搜索的最新進展,另有兩位搜索技術負責人對語音搜索的實際使用問題進行了演示說明。在活動中,百度方面接受新浪科技采訪時表示:堅信語音交互將是人機交互的趨勢所在,這個趨勢將取代鍵盤輸入。此外百度方面還向新浪科技透露:今年將有重磅產品推出,比去年百度世界大會上推出的度秘厲害得多。
百度語音搜索開放日:百度搜索產品架構師景鯤(左)、百度技術副總裁王海峰(中),百度多模搜索部總監孫雯玉(右)
語音搜索≠聽+說
百度技術副總裁王海峰
“語音搜索最常見的誤區是簡單以為只是聽和說的簡單串聯,其實并非如此。”王海峰開門見山說道。
這位百度技術副總裁緊接著對百度語音搜索的最新進展進行了介紹,表示目前的技術已經實現了語音技術、自然語言處理、智能搜索三方面的融合,以更自然的交互方式,對用戶所說更準確地識別,對需求理解更精準,進而能提供更滿意的結果。
王海峰現場進行了演示,“請問三亞明天的天氣怎么樣?”他按住語音助手說,搜索框隨機“打出”了王海峰的問題,并跳轉到天氣頁面,還自動朗讀起來:明天三亞天氣多云,23℃到31℃……
不過王海峰認為詢問天氣只是最基本的語音搜索,他緊接著演示了三個問題:“謝霆峰的兒子是誰”、“謝霆峰是誰的兒子”,“吳奇隆比劉詩詩大多少歲”……
王海峰表示,前兩個問題從傳統搜索認知來看,文字是完全一樣的,但問題缺截然不同,這其中涉及到了對于語言的理解和語義分析。最后一個問題則涉及兩個結果綜合之后的計算。
“百度語音搜索目前已通過人工智能做到了’聽’和’說’,而且還嘗試完成人類復雜的行為——溝通。集成了語音識別、語義理解、深度問答、知識推理、多輪對話、智能摘要、情感分析、語言生成、語音合成等能力,百度語音搜索已經能夠滿足用戶的多種復雜需求。”王海峰總結說。
此外,這位百度技術副總裁也談到了語音搜索和當下火熱的人工智能的關系。他表示人工智能實際上是希望讓機器可以擁有若干能力,可以讓機器學會人的聽、說、看、行,進而開始有思考——即機器學習,但就人的思考而言,和語言密切相關,后者是思考必需的知識和思維的載體。
王海峰強調說,語音搜索可以降低用戶搜索門檻,而且在大數據的基礎上可以轉換為更多的互聯網產品應用,實現人與信息及服務的更廣泛連接。
鍵盤要被消滅
百度多模搜索部總監孫雯玉
關于搜索門檻被降低的問題,百度多模搜索部總監孫雯玉進行了進一步演示介紹。
她表示語音搜索的好處是比鍵盤輸入“更直接、更快捷”。作為年輕媽媽,孫雯玉海舉例說,女兒現在找動畫片會直接通過語音搜索,“小孩基本不用教,甚至看你做一遍她就會了,她知道按住說話,就能找到自己想要的。”
語音搜索的直接和快捷同樣體現在老人群體身上,孫雯玉介紹說父母有山東口音,但是搜索在語音識別上沒有問題,“以前搜索需要組織語言思路,明確自己的問題,但是現在像我爸媽一樣在文字輸入上不習慣的群體,可以直接說,所說即所得。”
不過,這位多模搜索部總監也表示,針對中國方言眾多的情況,目前的主要版本還只是針對以普通話為主的北方方言和相近方言,粵語版、上海話版和西南官話等版本已經在開發中。
孫雯玉認為語音搜索的最大意義在于:通過技術讓人獲得信息和服務的門檻更低,隨著智能語音搜索進一步向前,可能會出現重大卻潤物無聲地變革——鍵盤交互將成為歷史,“我們的調研顯示,90后、00后有50%的群體的主要搜索方式已經變成了語音,而我女兒為代表的10后一代,基本從小的習慣就是語音搜索,她們這一代未來會覺得語音搜索是一件自然而然且天生如此的事情。”
物聯網大趨勢
語音搜索比鍵盤輸入搜索更便捷并不令人否認,但現場有記者認為語音搜索存在“場景”問題。
有媒體提問稱,不懷疑語音搜索的效率和便捷程度,但目前來講,拿著手機不斷說話搜索需要場景,特別涉及多輪交互,可能會變得調戲Siri一樣——只是個消遣游戲。
百度搜索產品架構師景鯤重點解答了場景問題。他覺得之所以目前還存在“場景”上的尷尬,主要有兩方面的原因。
首先是當前的用戶習慣了鍵盤輸入,對于語音搜索的轉換還需要一段時間,但不可否認的是隨著年輕群體進一步壯大,語音搜索會成為潮流,“這個群體已經被微信完成了市場教育,現在在地鐵上對著手機說話’看起來傻’的問題,估計以后大家都在做并且習慣了,就成為潮流了。”
其次是物聯網的進一步發展。景鯤表示,目前人機交互的最主要終端是手機,不過一旦物聯網進一步發展,人機交互突破了手機終端,需要在更多更廣泛的領域進行應用的時候,鍵盤輸入可能會變得很不方便,相反,語音輸入的優勢會不言自明。
景鯤認為,大的潮流和趨勢目前是可以預見的,語音搜索的普及只是時間問題而已。現在手機屏幕承載的東西特別多,有屏幕的東西大家都愿意看,沒有屏幕的東西就只能搜了。從潮流來看,語音交互絕對是主流。
新浪科技也就此向百度方面提問:“在物聯網大趨勢下,在硬件方面如何考慮,是否會涉足硬件領域?”
百度方面給出的回答是:不會涉足硬件。
“我們給語音搜索提供一個全方面的方案,跟各種各樣的廠商一起來合作,我們提供的是能力、信息和資源。我們去年推出了小機器人度秘,通過它來告訴外界我們有什么樣的能力,畢竟口說無憑,百度得把這個能力包裝成這樣一個產品,這些能力也可以放到廠商的設備上,我們做百度最擅長的,其他廠商做他們擅長的方面。”景鯤回答說,這個回答也得到了百度技術副總裁王海峰的贊同。
“但度秘在推出后似乎聲勢不大?”新浪科技進一步問道。
孫雯玉回答了該問題,這位百度多模搜索部總監解釋稱,度秘在去年推出是一個能力的展示,但度秘的普及應用過程中,可能涉及最多的問題是多輪交互,這對目前的產品形態和技術應用來說,一旦有不足,就很容易造成糟糕的用戶體驗,所以百度方面并沒有選擇大力推廣,目的是讓最大程度保證用戶體驗。
“但今年會有重磅得多的產品發布,比度秘要厲害得多。”百度搜索產品架構師景鯤補充道。