近日,中國乃至全球的第一份《數(shù)據(jù)競賽白皮書》(以下簡稱“白皮書”)發(fā)布,首次為我們從全局的角度盤點(diǎn)了數(shù)據(jù)競賽的發(fā)展歷程、現(xiàn)狀以及價值。白皮書指導(dǎo)單位為“大數(shù)據(jù)系統(tǒng)軟件國家工程實(shí)驗(yàn)室”,和鯨科技攜旗下第三方數(shù)據(jù)競賽平臺和鯨社區(qū)(Kesci),聯(lián)合AWS共同發(fā)布。
據(jù)發(fā)布方的信息顯示,白皮書通過搜集整理1000場全球競賽數(shù)據(jù)、1000余份問卷調(diào)研、幾十位行業(yè)專家及企業(yè)辦賽負(fù)責(zé)人的訪談、超過1200小時的分析研究,共同打造并發(fā)布了《數(shù)據(jù)競賽白皮書》(以下簡稱“白皮書”)。白皮書分為《數(shù)據(jù)競賽白皮書·上篇·1000場競賽的深度分析》和《數(shù)據(jù)競賽白皮書·下篇·辦好一場競賽的實(shí)操手冊》兩部分。
《數(shù)據(jù)競賽白皮書·上篇·1000場競賽的深度分析》中指出,數(shù)據(jù)競賽的發(fā)展起點(diǎn)可追溯至 1997 年首次問世的 KDD Cup,由國際頂會KDD 牽頭舉辦,這也是數(shù)據(jù)科學(xué)領(lǐng)域迄今為止最重要的國際賽事之一,至今已經(jīng)舉辦22年。
今天,就讓我們跟著白皮書一起,回顧一下這二十多年數(shù)據(jù)競賽與國際頂會的歷程吧。
2019年夏天有件令人驚喜的事件傳遍了全國——KDD CUP 2019三個賽道的冠軍全都被華人面孔拿下。被譽(yù)為數(shù)據(jù)挖掘領(lǐng)域「奧運(yùn)會」的 KDD CUP,從1997年到現(xiàn)在已經(jīng)舉辦了22屆,是目前數(shù)據(jù)挖掘領(lǐng)域最有影響力的賽事。也是從今年開始開始, KDD CUP 擁有了專屬的獨(dú)立議程,供世界數(shù)據(jù)挖掘界的頂尖專家、學(xué)者、工程師、學(xué)生等前來參賽,在KDD中的分量越來越重要。
K D D(Conference on KnowledgeDiscovery and Data Mining,知識發(fā)現(xiàn)和數(shù)據(jù)挖掘會議)隸屬于 ACM(Association forComputing Machinery,國際計(jì)算機(jī)學(xué)會),是響譽(yù)全球的頂級學(xué)術(shù)會議。1997 年, KDD 正式推出 KDD Cup,KDD Cup 要求參賽者通過數(shù)據(jù)分析,判斷出哪些人有可能成為美國癱瘓退伍軍人協(xié)會的捐贈者,從而幫助協(xié)會更精準(zhǔn)地發(fā)送求助郵件,開啟了數(shù)據(jù)競賽的新模式。此后,KDD Cup 保持了一年一度的舉辦慣例。
1999 年KDD Cup 的賽題更為經(jīng)典,選用了來自美國國防部高級規(guī)劃署在 MIT 林肯實(shí)驗(yàn)室操作進(jìn)行的入侵檢測評估項(xiàng)目數(shù)據(jù),希望參賽者能夠分辨那些操作是外部入侵,獲勝者是廣為人知的統(tǒng)計(jì)分析軟件公司 SAS。作為數(shù)據(jù)挖掘領(lǐng)域影響力最廣、水平最高的國際頂級賽事,KDD Cup 20 余年以來的賽題設(shè)計(jì)始終帶有鮮明的工業(yè)應(yīng)用色彩,每年都會吸引大量優(yōu)秀的企業(yè)、高?;蚩蒲袡C(jī)構(gòu)協(xié)辦賽事,或直接參給與競賽角逐。
通過KDD Cup 的歷年成果上不難看出,雖然面臨的問題日益復(fù)雜,但始終帶有強(qiáng)烈的工業(yè)應(yīng)用色彩,高度契合各類組織機(jī)構(gòu)的實(shí)際需求,不斷涌現(xiàn)出全新的應(yīng)用場景。KDD Cup的成功,帶動了ICCV、NeurlPS、ISBI、Euro CSS、ECML-PKDD、VoxCeleb、MICCAI、C-MIMI、IEEE-CIS、CVPR(ActivityNet)、IWCS、ECCV 等國際頂尖學(xué)術(shù)會議紛紛加入這一浪潮。
他們除了在世界不同地域舉行年度性盛會外,也開始聯(lián)手全球各地的企業(yè)、科研機(jī)構(gòu)共同籌辦數(shù)據(jù)競賽,以短時間競賽的形式幫助前沿數(shù)據(jù)科學(xué)技術(shù)的進(jìn)一步發(fā)展。這類享有頂會權(quán)威背書和國際影響力的重大賽事在全球范圍內(nèi)得到了積極響應(yīng),參賽對象不僅限于技術(shù)水平突出的個人,還囊括了科研實(shí)驗(yàn)室、高校和企業(yè)等一系列組織。
國際頂會數(shù)據(jù)競賽也往往會積極兼顧市場應(yīng)用的需求,通過與企業(yè)、政府機(jī)構(gòu)合作,聚集當(dāng)下技術(shù)與數(shù)據(jù)應(yīng)用中的難點(diǎn)尋求解決思路, 不斷縮短科研成果與落地應(yīng)用之間的距離,賽題內(nèi)容廣泛覆蓋醫(yī)療、軍事、互聯(lián)網(wǎng)、交通出行、快消零售、生態(tài)及文化保護(hù)等眾多場景。
中國企業(yè)、高校及科研機(jī)構(gòu)和個人參賽者在國際頂會數(shù)據(jù)競賽的獲獎次數(shù)呈現(xiàn)逐年上升的趨勢,亦反應(yīng)了中國在數(shù)據(jù)科學(xué)領(lǐng)域的實(shí)力和影響力不斷加強(qiáng)。在中國也有一些企業(yè)開始和國際頂會合作,舉辦基于行業(yè)應(yīng)用的數(shù)據(jù)競賽。而數(shù)據(jù)競賽的進(jìn)程也伴隨著人工智能相關(guān)科技專利的爆發(fā)期,從2000年開始不斷向上。
根據(jù)麥肯錫全球研究院發(fā)布的 MGI 行業(yè)數(shù)字化指數(shù)報告,在產(chǎn)業(yè)數(shù)字化動態(tài)發(fā)展的過程中,完備的數(shù)字資產(chǎn)積累、充分的資本投入與研發(fā)、可持續(xù)的人才連接與協(xié)同推進(jìn)了產(chǎn)業(yè)數(shù)字化程度的不斷加深,進(jìn)而帶來了較高的平均利潤增長率以及勞動增長率。
《數(shù)據(jù)競賽白皮書》中提到,通過數(shù)據(jù)競賽形式并以此建立基于數(shù)據(jù)價值流動的生態(tài)系統(tǒng),才能充分利用生態(tài)內(nèi)不斷升級的人才資源和技術(shù)資源賦能商業(yè)發(fā)展,已成為越來越多商業(yè)領(lǐng)袖的共識。相較于傳統(tǒng)的數(shù)字化進(jìn)程,主動采用數(shù)字化戰(zhàn)略的企業(yè)明顯能在后續(xù)發(fā)展中與競爭對手拉開差距。
中國數(shù)據(jù)競賽的崛起并非偶然,也不止是對國外先進(jìn)模式的亦步亦趨,而是在技術(shù)落地應(yīng)用需求增長、宏觀政策支持和云計(jì)算基礎(chǔ)不斷成熟等原因之下的必然結(jié)果。建立基于數(shù)據(jù)價值流動的生態(tài)系統(tǒng),充分利用生態(tài)內(nèi)不斷升級的人才資源和技術(shù)資源賦能商業(yè)發(fā)展,已成為越來越多商業(yè)領(lǐng)袖的共識。
據(jù)悉,在《數(shù)據(jù)競賽白皮書·下篇·辦好一場競賽的實(shí)操手冊》中,和鯨科技將首次公開自身100+場專業(yè)賽事的服務(wù)經(jīng)驗(yàn),開源其數(shù)據(jù)競賽管理的方法論,這將對數(shù)據(jù)競賽行業(yè)產(chǎn)生不小的沖擊。和鯨科技是中國對標(biāo)Kaggle成立的,最早的數(shù)據(jù)競賽平臺之一,且在這個過程中形成了在用戶數(shù)、用戶質(zhì)量、活躍度方面均有出色表現(xiàn)的中國數(shù)據(jù)科學(xué)家社區(qū)——和鯨社區(qū)(由Kesci發(fā)展而來)。在和鯨社區(qū)上,有來自中國聯(lián)通、中國平安、招商銀行、騰訊、百度、字節(jié)跳動、攜程、IBM、華為、默克中國、南京市人民政府、深圳市人民政府、鵬城實(shí)驗(yàn)室等頭部企業(yè)與機(jī)構(gòu)舉辦數(shù)據(jù)競賽。通過開放競賽的機(jī)制和數(shù)據(jù)科學(xué)的手段,解決各個行業(yè)的業(yè)務(wù)難題。
國內(nèi)最高規(guī)格的大數(shù)據(jù)競賽,由教育部主辦的“中國高校計(jì)算機(jī)大賽-大數(shù)據(jù)挑戰(zhàn)賽”,以及獎金規(guī)模最大的人工智能大賽,由深圳市政府主辦的“全國人工智能大賽”,都選擇在和鯨社區(qū)完成全流程的組織。由此可見,《數(shù)據(jù)競賽白皮書·下篇·辦好一場競賽的實(shí)操手冊》必然會促進(jìn)“數(shù)據(jù)競賽”這一高效、敏捷的數(shù)字化創(chuàng)新模式,在中國進(jìn)一步發(fā)展。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!
隨著數(shù)字中國戰(zhàn)略的步步落實(shí),大數(shù)據(jù)已經(jīng)成為錨定戰(zhàn)略定位、搶得市場先機(jī)的重要基礎(chǔ)元素。為彰顯行業(yè)發(fā)展現(xiàn)狀,遴選、推薦優(yōu)秀企業(yè),長城戰(zhàn)略咨詢近日在2023中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會期間,重磅發(fā)布《中國大數(shù)據(jù)獨(dú)角獸企業(yè)榜單》,根據(jù)獨(dú)角獸企業(yè)國家推薦性標(biāo)準(zhǔn),篩選出259家2022年中國大數(shù)據(jù)(潛在)獨(dú)角獸企業(yè)
2023年6月15日至18日,2023北京健康醫(yī)療大數(shù)據(jù)論壇、醫(yī)促會華夏健康數(shù)據(jù)與數(shù)字醫(yī)學(xué)高峰論壇、第三屆中華預(yù)防醫(yī)學(xué)會腎臟病預(yù)防與控制專業(yè)委員會學(xué)術(shù)會議將同期于北京舉行。論壇以“學(xué)術(shù)引領(lǐng)數(shù)智健康”為主題,著眼國家戰(zhàn)略需求,聚焦前沿科技在健康醫(yī)療領(lǐng)域的發(fā)展與實(shí)踐,薈萃全球頂尖學(xué)術(shù)觀點(diǎn),促進(jìn)多方跨界融
近日,北京市科學(xué)技術(shù)委員會、中關(guān)村科技園區(qū)管理委員會公示了北京市2023年第2批科技型中小企業(yè)名單,谷器數(shù)據(jù)借助優(yōu)秀的科技自主創(chuàng)新能力成功入選。此次評價指標(biāo)圍繞科研人員、研發(fā)投入、科技成果等三個維度,成功入選科技型中小企業(yè)是對谷器數(shù)據(jù)專業(yè)化發(fā)展、自主創(chuàng)新能力、產(chǎn)品技術(shù)實(shí)力的激勵與肯定??萍夹椭行∑髽I(yè)
評審寄語面向車間現(xiàn)場生產(chǎn)制造過程的數(shù)字化管理,谷器數(shù)據(jù)SupplyX·MES通過推動更有效的工廠運(yùn)行和現(xiàn)場效率,提供從接收生產(chǎn)計(jì)劃到制成最終產(chǎn)品全過程的生產(chǎn)活動實(shí)現(xiàn)優(yōu)化的信息,成為新型工業(yè)化的標(biāo)桿力量!近日,由中國科學(xué)院《互聯(lián)網(wǎng)周刊》、中國社會科學(xué)院信息化研究中心等機(jī)構(gòu)聯(lián)合主辦的“2023(第八屆)
在如今這個數(shù)字化轉(zhuǎn)型時代,大數(shù)據(jù)在企業(yè)發(fā)展的過程中發(fā)揮了至關(guān)重要的作用,大數(shù)據(jù)技術(shù)以更高效和有效的方式提供最好的服務(wù),同時還可以提高生產(chǎn)力、提高客戶滿意度和更高效的智慧化運(yùn)營。其中,成都四方偉業(yè)軟件股份有限公司(以下簡稱“四方偉業(yè)”)以優(yōu)秀的大數(shù)據(jù)產(chǎn)品和服務(wù)獲得了多項(xiàng)行業(yè)榮譽(yù)。去年,2022數(shù)博會數(shù)
把脈中國數(shù)據(jù)智能化
2023年,幾乎可以被定義為中國互聯(lián)網(wǎng)公司的“大模型元年”。ChatGPT的全球爆紅,徹底點(diǎn)燃國內(nèi)的大模型賽道,曾經(jīng)的“創(chuàng)業(yè)英雄”、如今的商業(yè)領(lǐng)袖們親自下場,接連發(fā)布生成式人工智能產(chǎn)品與大模型布局。大模型火了,沉寂許久的互聯(lián)網(wǎng)行業(yè)又有了新的“戰(zhàn)事”。同時,大模型的快速發(fā)展也改變了云市場的現(xiàn)狀,企業(yè)對
近日,數(shù)字化市場研究咨詢機(jī)構(gòu)愛分析發(fā)布了《2022愛分析·數(shù)據(jù)智能廠商全景報告》,愛分析從技術(shù)研發(fā)能力、服務(wù)客戶數(shù)量、收入規(guī)模等維度對廠商進(jìn)行了全面專業(yè)的評估
2022年11月18日,首個國家級大數(shù)據(jù)產(chǎn)業(yè)創(chuàng)新賽事——2022第一屆中國大數(shù)據(jù)大賽圓滿落幕。工業(yè)和信息化部信息技術(shù)發(fā)展司數(shù)字經(jīng)濟(jì)推進(jìn)處處長張建倫,中國電子技術(shù)標(biāo)準(zhǔn)化研究院副院長孫文龍出席頒獎典禮并致辭
2022年11月17日,在廈門市工業(yè)和信息化局的指導(dǎo)下,以“數(shù)據(jù)確權(quán)”為主題的2022數(shù)據(jù)資產(chǎn)(廈門)論壇在廈門成功舉辦。本次論壇以“數(shù)據(jù)確權(quán)”為主題,由廈門市互聯(lián)網(wǎng)域名應(yīng)用服務(wù)產(chǎn)業(yè)協(xié)會和構(gòu)信網(wǎng)(公信.中國)聯(lián)合主辦
近日,國內(nèi)知名數(shù)字化市場研究咨詢機(jī)構(gòu)愛分析正式發(fā)布《2022愛分析·信創(chuàng)廠商全景報告》(以下簡稱“報告”)。報告綜合考慮企業(yè)關(guān)注度、行業(yè)落地進(jìn)展等因素,遴選出在信創(chuàng)市場中具備成熟解決方案和落地能力的廠商。
10月31日下午,由數(shù)博會執(zhí)委會主辦、數(shù)據(jù)觀(北京)傳媒科技有限公司承辦、貴陽大數(shù)據(jù)交易所協(xié)辦的第四期數(shù)博思享會“實(shí)踐先行觀公共數(shù)據(jù)價值與應(yīng)用”活動成功舉辦。
近日,由中國國際數(shù)字經(jīng)濟(jì)博覽會組委會主辦,中國電子技術(shù)標(biāo)準(zhǔn)化研究院、河北省工業(yè)和信息化廳承辦的“第一屆中國大數(shù)據(jù)大賽”(簡稱大數(shù)據(jù)大賽)正式啟動。
廣州光點(diǎn)信息科技有限公司自主研發(fā)的數(shù)據(jù)中臺產(chǎn)品GI大數(shù)據(jù)中臺V2.0產(chǎn)品是國內(nèi)率先推出符合新創(chuàng)標(biāo)準(zhǔn)的中臺產(chǎn)品,基于“大數(shù)據(jù)+AI”等技術(shù)全新打造,集數(shù)據(jù)采集、融合、治理、服務(wù)、管理為一體的旗艦平臺。
廣州光點(diǎn)信息科技有限公司自主研發(fā)的數(shù)據(jù)中臺產(chǎn)品GI大數(shù)據(jù)中臺V2.0產(chǎn)品是國內(nèi)率先推出符合新創(chuàng)標(biāo)準(zhǔn)的中臺產(chǎn)品,基于“大數(shù)據(jù)+AI”等技術(shù)全新打造,集數(shù)據(jù)采集、融合、治理、服務(wù)、管理為一體的旗艦平臺