當前位置:首頁 >  科技 >  互聯(lián)網 >  正文

發(fā)布知音引擎 搜狗為何能在人工智能技術上屢占先機?

 2016-08-05 14:59  來源: A5專欄   我來投稿 撤稿糾錯

  域名預訂/競價,好“米”不錯過

文 ▍李東樓(微信號:lidonglou)

在美國導演斯派克·瓊斯編劇并執(zhí)導的一部科幻愛情片《她》(Her)當中,語音交互幾乎成為了人們與手機、電腦等設備進行交互的唯一手段,打電話、寫信、處理工作郵件等等,都通過語音向計算機發(fā)出指令。而且其中的人工智能操作系統(tǒng)OS1還與人類有了情感交流,談起了戀愛,而影片的背景被設定在2025年,也就是從現(xiàn)在算起九年之后。

當然,我們無法預測,人工智能在九年后究竟會不會發(fā)達到這個地步?但眼下可以肯定的是,人工智能技術確實已經開始從實驗室逐步走近我們的生活,尤其是今年年初的谷歌alphago圍棋機器人和李世石的人機對決大戰(zhàn),更是讓人們首次見識到人工智能的強大之處。而在昨天,搜狗語音發(fā)布了不僅“能聽會說”,還具有“能理解會思考”的能力的語音交互引擎技術—知音,這再次刷新了在場所有人對于人工智能技術發(fā)展的認知。

搜狗知音引擎發(fā)布,展現(xiàn)搜狗在人工智能方面的自信

就如同影片《她》當中,男主人公通過語音寫信一般,基于語音識別和語義理解技術方面的進步,搜狗語音早已達到了可以實時轉寫的地步。值得一提是,在昨天的發(fā)布會上,嘉賓的發(fā)言就通過搜狗知音交互引擎實時轉寫并呈現(xiàn)在大屏幕上,不僅語音識別速度快,而且準確率也相當高,基本上能夠達到90%以上,令人驚嘆技術的進步。

而這還只是搜狗知音引擎的簡單“炫技”,除了語音識別之外,根據搜狗CTO楊洪濤介紹,搜狗知音引擎還支持用戶直接用自然語言進行糾錯,比如用戶可以說:“把‘張’修改為立早‘章’,或者把‘張’修改為文章的’章’。并且還支持多輪對話,比如用戶說我要去首都機場,搜狗知音引擎便會問 T1還是 T2,當用戶確定航站樓后,它會問是出發(fā)還是接人。這就意味著搜狗知音引擎能夠處理更加復雜的交互邏輯,以及更好的感知用戶語音請求背后的真正需求,這顯然語音交互方面的一大技術進步。

要知道,在兩年前,尤其是蘋果Siri的推出,語音交互作為一種面向未來的交互方向,就備受各大互聯(lián)網公司的重視和看好。包括搜狗、百度、微軟等科技公司都推出了語音助手產品,期待產品能夠作為移動互聯(lián)網的一大入口。不過,現(xiàn)在看來,無論是Siri,還是微軟的小娜,都在用戶短暫的熱捧之后,漸漸沉默。事實上,這其實算是第一代的人工智能初級產品,這些產品更多的是扮演著一個小助手或者秘書的角色,只能夠簡單的處理一些打電話、發(fā)短信、天氣預報查詢等等,一旦遇到稍微復雜的問題,語音助手便無法處理,一般都只好賣萌耍滑,這就使得產品的實用性并不強,用戶嘗試使用更多的是抱著娛樂的心態(tài),而并不是真正的剛性需求。

不過,時隔兩年之后,各大科技公司的語音交互技術有了顯著的提升。尤其是在這次搜狗發(fā)布的語音交互引擎技術當中更能夠感受到技術的進步之快。根據了解,目前搜狗的語音交互引擎技術已經應用在包括搜狗輸入法、搜狗搜索、搜狗地圖等在內的搜狗全線產品當中,而根據搜狗語音交互中心負責人王硯峰在現(xiàn)場的演示,運用在搜狗搜索、搜狗地圖導航等應用上的搜狗語音交互引擎技術,在語音識別率以及多輪語音交互的處理等方面,已經顯著領先于競爭對手。

而且,這并不是搜狗第一次展現(xiàn)自己在智能語音方面的技術能力,以及布局人工智能技術的決心。在今年6月份的搜狗輸入法十周年上,搜狗CEO王小川就提出了將人工智能定位搜狗輸入法的下一階段戰(zhàn)略發(fā)展的新方向,搜狗CTO楊洪濤則首次透露了搜狗輸入法的快速分享、聰明回復和妙筆修飾等目前正在研發(fā)的三個能夠增強用戶表達能力的人工智能新技術;而在7月份剛剛結束的奇點創(chuàng)新者峰會上,搜狗CEO王小川更是直接邀請一名現(xiàn)場觀眾上臺直接演示完全通過自然語音來發(fā)送一段短信息,這也體現(xiàn)了搜狗在其人工智能技術方面的強大自信。

搜狗知音引擎發(fā)布背后,搜狗早有“預謀”

另一方面,盡管搜狗今年才開始陸續(xù)對外展示自己在人工智能技術實力,但顯然搜狗在人工智能的研究和布局并不是剛剛開始。實際上,搜狗在人工智能領域的研究和布局早已開始,搜狗CTO楊洪濤在知音交互引擎發(fā)布會上就透露:“搜狗從12年開始研發(fā)智能語音技術,并在13年開始進行深度學習,自然交互和知識計算是搜狗在人工智能領域的兩大戰(zhàn)略方向,目前搜狗在人工智能領域的研發(fā)已經全面展開。”

搜狗在人工智能領域的布局不僅起步早,而且與谷歌、百度等搜索引擎公司一樣,屬于天生就擁有人工智能基因的公司。這是因為搜索引擎擁有海量的搜索數(shù)據,而通過數(shù)據挖掘之后,便能夠實現(xiàn)人工智能的最后一個階段-機器深度學習。也因如此,我們看到,谷歌不僅推出了圍棋機器人alphago,更是在更名為Alphabet后,全面轉型成為了人工智能公司;而百度同樣將人工智能作為其未來的一大發(fā)展方向。搜狗則在今年第一季度發(fā)布財報時,由搜狗CEO王小川首次明確其成為“中國人工智能領域的創(chuàng)新者和領先公司”的決心和野心。而與此相伴隨的則是在人工智能技術方面的大手筆投入。最具有代表型的便是,今年4月份向清華大學捐贈1.8億元,與其聯(lián)合成立“清華大學天工智能計算研究院”,深入開展人工智能領域的前沿技術研究。這意味著搜狗開始全面從搜索引擎公司升級成為人工智能公司。

實際上,搜狗之所以能夠在智能語音技術方面能夠如此大的突破,除了具有人工智能基因和提早布局之外,更重要的還是要歸功于搜狗在此前十幾年的過程中,積累的數(shù)億用戶以及由此每天產生的海量交互數(shù)據,而這些為機器學習提供了優(yōu)秀的“土壤”,也使得人工智能越來越聰明。搜狗語音交互引擎這一成果取得的背后,顯然離不開日均語音搜索次數(shù)增長超過4倍的搜狗搜索和擁有海量詞庫、日均語音輸入超過1.4億次的搜狗手機輸入法,正是這兩大產品聯(lián)手讓搜狗智能語音成為目前國內語音輸入功能使用量最大的移動手機產品,而這就意味著搜狗的語音交互技術有更多的“學習”機會。

不過,盡管搜狗語音交互引擎技術在當下已經足夠讓人驚艷,但是離電影《她》當中所描述的人工智能場景還有距離。比如《她》當中人工智能OS1除了幫助處理工作和生活瑣事之外,還能夠與人類戀愛,并深刻理解人類復雜的感情。顯然,現(xiàn)在通過自然語言實現(xiàn)人機交互只是人工智能的第一步,未來真正實現(xiàn)擬人化的交流甚至更高級的情感交流才是更高的境界,也因如此,下一次搜狗們能夠推出什么樣的驚艷的產品或技術就更值得期待。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關標簽
搜狗
人工智能

相關文章

熱門排行

信息推薦