當前位置:首頁 >  科技 >  IT業(yè)界 >  正文

首屆“面向智能問答的篇章排序”比賽落幕 搜狗搜索掀起智能問答研究熱潮

 2017-07-17 16:28  來源: 互聯網   我來投稿 撤稿糾錯

  域名預訂/競價,好“米”不錯過

7月12日至14日,第二十三屆全國信息檢索學術會議(簡稱CCIR2017)在上海召開。大會最后一天,由搜狗搜索與CCIR2017聯合舉辦的全國首屆“面向智能問答的篇章排序”比賽評測報告、九支代表隊伍技術報告及頒獎典禮也隆重舉行,標志著這場歷時三個多月的大型評測比賽圓滿落下帷幕。

為了持續(xù)推動中文信息檢索技術和自然語言處理技術的發(fā)展及應用,搜狗搜索于今年4月1日聯合CCIR2017共同發(fā)起“面向智能問答的篇章排序”比賽。作為國內首次大規(guī)模真實用戶問答數據集上的問答評測任務,本次大賽吸引了國內近85所高校學生及一批業(yè)內研究者的積極參與。

按照賽制,參賽者需在給定問題下,設計排序方法對候選篇章進行排序,并盡可能將包含正確答案的篇章排在前面,最終按照篇章所含答案的完整度進行評定。本次大賽中,北京大學、華中科技大學、哈爾濱工業(yè)大學語言技術研究中心三支戰(zhàn)隊,從眾多參賽隊伍中脫穎而出榮膺三甲,分別獲得由CCIR2017與中國計算機協會(CCF)提供的成績證書,及搜狗搜索提供的豐厚獎金。

作為大賽的聯合主辦方,搜狗搜索除了為廣大高校學生、業(yè)內研究者提供展示和學習的平臺外,更是借此機會,提供智能問答領域的大規(guī)模公開數據集,以促進學術界和業(yè)界在智能問答領域的研究發(fā)展,鼓勵學術交流,提升研究水平。

目前在智能問答研究領域,可用的大規(guī)模公開數據集,尤其是反映真實用戶問答需求的中文數據集非常稀缺。這很大程度上限制了業(yè)界及學術界關于智能問答的研究,使其研究局限于“事實性問答”領域,而無法涉及以滿足廣泛用戶的通用問答需求為目標的“開放域智能問答”領域。

作為國內第二大搜索引擎,搜狗搜索是當前用戶獲取信息的重要手段,為大規(guī)模高質量問答數據的生成提供了可能性。據了解,構建“開放域智能問答系統”涉及到復雜的自然語言理解、大規(guī)模數據處理、機器學習、知識抽取和表示等人工智能研究領域的前沿技術,對這些技術的研究依賴大規(guī)模高質量的數據。此次“面向智能問答的篇章排序”比賽中,搜狗搜索先后公布了來自用戶真實搜索需求的5萬個問題,以及從搜狗搜索全網檢索結果提供的50萬條候選篇章。

事實上,基于對用戶搜索行為及需求的洞察,搜狗搜索早已前瞻性地指出,搜索的未來是“智能問答”。通過“智能問答”,用戶可以用自然語言與機器交流,搜索引擎不再是返回10條結果,而是像人一樣給出答案和建議。搜索結果不只是匹配,而更是走到了理解的角度。基于此,搜狗搜索的人工智能技術堅持以自然語言處理為核心,在語言的基礎上做自然交互和知識計算,并著力問答方向的技術創(chuàng)新,切實推進產品落地,服務用戶搜索場景。

目前已經上線的搜狗“立知問答系統”就是搜狗研發(fā)的面向未來的搜索技術,在理解用戶的問題或信息需求后,“立知問答系統”利用海量網絡信息及大規(guī)模知識庫,能夠直接給用戶提供答案。目前,搜狗立知不僅能精準回答事實性問題,在分析類問題、觀點類問題、數字類問題等領域,都能直接返回精確答案。而“立知問答系統”直接給出答案的背后,則包含了語義分析、問題理解、信息抽取、知識圖譜、信息檢索、深度學習等眾多人工智能技術。

“智能問答”能夠讓信息和知識的獲取變得更加便捷,是自然語言處理和人工智能領域的前沿研究課題。作為行業(yè)引領者的搜狗搜索,以開放態(tài)度向學術界及業(yè)界提供智能問答領域的大規(guī)模公開數據集,鼓勵學術交流,對行業(yè)“智能問答”研究的推進意義重大。

據悉,第二屆“CIPS-SOGOU問答比賽”已經在籌備階段。屆時,作為主辦方的搜狗搜索,將會公開更多數據集,為廣大高校生和業(yè)內研究者提供更大的學習展示平臺,從而引領學界和業(yè)界在智能問答研究領域不斷取得突破。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關標簽
搜狗問答

相關文章

熱門排行

信息推薦