3月5日,兩會正式召開。因為今年疫情防控工作的持續(xù),今年的兩會現(xiàn)場仍采取了現(xiàn)場+網(wǎng)絡(luò)視頻采訪雙通道的方式進行,給了5G、4K、AR、VR等數(shù)字創(chuàng)新技術(shù)充分的發(fā)揮空間。
新華社作為官方媒體全程報道,在運用五面LED屏、結(jié)合多角度三維縫合技術(shù)搭建的演播室里,塑造了一位既能在演播室和主持人默契搭檔,也能跨屏穿越千里與嘉賓互動的AI虛擬主播。虛擬主播不僅打破了虛擬與現(xiàn)實空間的阻隔,而且表現(xiàn)力出眾,神情姿態(tài)能與文本、情境實時適配,為廣大觀眾帶來跨場景的沉浸式報道。
【圖源:新華網(wǎng)】
新華社AI虛擬主播所運用的VR/AR技術(shù),正是本次兩會數(shù)字經(jīng)濟規(guī)劃草案中重點提及的內(nèi)容。作為數(shù)字經(jīng)濟重點產(chǎn)業(yè)之一,VR/AR將在未來的內(nèi)容創(chuàng)作及互動領(lǐng)域扮演重要角色。
技術(shù)創(chuàng)新+發(fā)展工具,加速數(shù)字經(jīng)濟發(fā)展
兩會規(guī)劃綱要草案提出,將發(fā)展云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)、工業(yè)互聯(lián)網(wǎng)、區(qū)塊鏈、人工智能、虛擬現(xiàn)實和增強現(xiàn)實等七大數(shù)字經(jīng)濟重點產(chǎn)業(yè),以及智能交通、智慧能源、智能制造等十大數(shù)字化應用場景,2025年數(shù)字經(jīng)濟核心產(chǎn)業(yè)增加值占GDP比重達到10%。
涉及VR和AR部分,兩會草案提到,未來將推動三維圖形生成、動態(tài)環(huán)境建模、實時動作捕捉、快速渲染等技術(shù)創(chuàng)新,發(fā)展虛擬現(xiàn)實整機、感知交互、內(nèi)容采集制作等設(shè)備和開發(fā)工具軟件、行業(yè)解決方案。
【圖源:人民日報微博】
那么,草案中提及的技術(shù)和方案各是什么呢,又有哪些應用場景呢?
【動態(tài)環(huán)境建?!?/p>
虛擬環(huán)境的建立是虛擬現(xiàn)實技術(shù)的核心內(nèi)容。動態(tài)環(huán)境建模技術(shù)的目的是獲取實際環(huán)境的三維數(shù)據(jù),并根據(jù)應用的需要,利用獲取的三維數(shù)據(jù)建立相應的虛擬環(huán)境模型。在規(guī)則環(huán)境下,三維數(shù)據(jù)的獲取可以采用CAD技術(shù),而更多的環(huán)境則需要采用非接觸式的視覺建模技術(shù),兩者的有機結(jié)合可以有效地提高數(shù)據(jù)獲取的效率。
【三維圖形生成】
三維圖形的生成技術(shù)的關(guān)鍵在于如何實現(xiàn)“實時”生成。為達到實時生成的目的,至少要保證圖形的刷新率不低于15幀/秒,最好高于30幀/秒。在不降低圖形的質(zhì)量和復雜度的前提下,如何提高刷新頻率將是該技術(shù)的主要研究內(nèi)容。
【實時動作捕捉】
動作捕捉(Motion capture)又稱運動捕捉,是指記錄并處理人或其他物體動作的技術(shù)。它廣泛應用于軍事,娛樂,體育,醫(yī)療應用,計算機視覺以及機器人技術(shù)等諸多領(lǐng)域。在電影制作和電子游戲開發(fā)領(lǐng)域,它通常是記錄人類演員的動作,并將其轉(zhuǎn)換為數(shù)字模型的動作,并生成二維或三維的計算機動畫。
【快速渲染】
渲染是指用軟件從模型生成圖像的過程。未來將發(fā)展基于視覺特性、頭動交互的渲染優(yōu)化算法,加快高性能GPU配套時延優(yōu)化算法的研發(fā)與產(chǎn)業(yè)化。突破新一代圖形接口、渲染專用硬加速芯片、云端渲染、光場渲染、視網(wǎng)膜渲染等關(guān)鍵技術(shù),推動渲染處理技術(shù)向高畫質(zhì)、低時延、低功耗方向發(fā)展。
【虛擬現(xiàn)實整機】
虛擬現(xiàn)實整機擺脫依附在其他計算終端上的限制,做到數(shù)據(jù)無線傳輸、計算實時處理、產(chǎn)品體積輕巧等特點,虛擬現(xiàn)實整機的出現(xiàn)讓虛擬現(xiàn)實誕生了統(tǒng)一的體驗標準,從而讓VR內(nèi)容可以制作的更加極致。
【感知交互】
加快六軸及以上GHz慣性傳感器、3D攝像頭等的研發(fā)與產(chǎn)業(yè)化。發(fā)展魯棒性強、毫米級精度的自內(nèi)向外(inside-out)追蹤定位設(shè)備及動作捕捉設(shè)備。加快浸入式聲場、語音交互、眼球追蹤、觸覺反饋、表情識別、腦電交互等技術(shù)的創(chuàng)新研發(fā),優(yōu)化傳感融合算法,推動感知交互向高精度、自然化、移動化、多通道、低功耗等方向發(fā)展。
【內(nèi)容采集】
發(fā)展全視角12K分辨率、60幀/秒幀率、高動態(tài)范圍(HDR)、多攝像機同步與單獨曝光、無線實時預覽等影像捕捉技術(shù),重點突破高質(zhì)量全景三維實時拼接算法,實現(xiàn)開發(fā)引擎、軟件、外設(shè)與頭顯平臺間的通用性和一致性。
XR與行業(yè)結(jié)合,拓展應用空間
VR、AR和MR等技術(shù)融合應用了多媒體、傳感器、新型顯示、互聯(lián)網(wǎng)和人工智能等多領(lǐng)域技術(shù),能夠拓展人類感知能力,改變產(chǎn)品形態(tài)和服務(wù)模式,給經(jīng)濟、科技、文化、軍事、生活等領(lǐng)域帶來深刻影響。
據(jù)工信部指導意見,未來將引導和支持“XR+”發(fā)展,推動虛擬現(xiàn)實技術(shù)產(chǎn)品在制造、教育、文化、健康、商貿(mào)等行業(yè)領(lǐng)域的應用,創(chuàng)新融合發(fā)展路徑,培育新模式、新業(yè)態(tài),拓展虛擬現(xiàn)實應用空間。
【XR+制造】虛擬現(xiàn)實技術(shù)在制造業(yè)研發(fā)設(shè)計、檢測維護、操作培訓、流程管理、營銷展示等環(huán)節(jié)具有豐富應用前景,可以提升制造企業(yè)輔助設(shè)計能力和制造服務(wù)化水平。通過推進虛擬現(xiàn)實技術(shù)與制造業(yè)數(shù)據(jù)采集與分析系統(tǒng)的融合,可以實現(xiàn)生產(chǎn)現(xiàn)場數(shù)據(jù)的可視化管理,提高制造執(zhí)行、過程控制的精確化程度,推動協(xié)同制造、遠程協(xié)作等新型制造模式發(fā)展。
【XR+教育】虛擬現(xiàn)實技術(shù)在高等教育、職業(yè)教育等領(lǐng)域和物理、化學、生物、地理等實驗性、演示性課程中有極佳的應用場景。通過構(gòu)建虛擬教室、虛擬實驗室等教育教學環(huán)境,發(fā)展虛擬備課、虛擬授課、虛擬考試等教育教學新方法,可以促進以學習者為中心的個性化學習,推動教、學模式轉(zhuǎn)型。
【XR+文化】在文化、旅游和文物保護等領(lǐng)域,XR技術(shù)有助于豐富融合虛擬現(xiàn)實體驗的內(nèi)容供應,推動現(xiàn)有數(shù)字內(nèi)容向虛擬現(xiàn)實內(nèi)容的移植,以進一步滿足人民群眾文化消費升級需求。
目前直播短視頻領(lǐng)域已經(jīng)大量應用XR技術(shù),典型用例如包含美顏美體功能在內(nèi)的AR視頻特效。廣泛的市場需求催生出了諸如相芯科技等一批優(yōu)秀的技術(shù)公司。另外在文物古跡復原、文物和藝術(shù)品展示、雕塑和立體繪畫等文化藝術(shù)領(lǐng)域,XR技術(shù)通過三維圖像生成和數(shù)字圖像技術(shù),可規(guī)?;瘜崿F(xiàn)文物和藝術(shù)作品的3D數(shù)字化,對保存和展示都有重要意義。
【XR+健康】虛擬現(xiàn)實技術(shù)在醫(yī)療教學訓練與模擬演練、手術(shù)規(guī)劃與導航等環(huán)節(jié)具有豐富應用價值,可以推動提高醫(yī)療服務(wù)智能化水平。另外,虛擬現(xiàn)實技術(shù)在心理輔導、康復護理等環(huán)節(jié)的應用,是對現(xiàn)有診療手段的補充完善,還可發(fā)展虛擬現(xiàn)實居家養(yǎng)老、在線診療、虛擬探視服務(wù),提高遠程醫(yī)療水平。
【XR+商貿(mào)】順應電子商務(wù)、家裝設(shè)計、商業(yè)展示等領(lǐng)域場景式購物趨勢,基于XR技術(shù)的展示系統(tǒng)與導購模式正越來越普及,譬如虛擬直播助手正成為電商直播間的重要補充。提供個性化、定制化的地產(chǎn)、家居、家電、室內(nèi)裝修和服飾等虛擬設(shè)計、體驗與交易平臺,發(fā)展虛擬現(xiàn)實購物系統(tǒng),創(chuàng)新商業(yè)推廣和購物體驗模式,是XR與商貿(mào)結(jié)合的有效形式。
XR生態(tài)成未來數(shù)字經(jīng)濟重點
2021年是十四五規(guī)劃的開局之年,科技創(chuàng)新與數(shù)字生態(tài)建設(shè),儼然成為今年政府工作報告中重點強調(diào)的方向之一。其中,XR技術(shù)以其獨有的打破虛擬與現(xiàn)實隔閡的效果,正成為未來內(nèi)容創(chuàng)作及互動的重要工具。
無獨有偶,兩會上,全國人大代表、敦煌研究院副院長蘇伯民倡議利用XR技術(shù)推進敦煌文物數(shù)字化。蘇伯民在接受《中國旅游報》記者采訪時表示,優(yōu)秀文化遺產(chǎn)的數(shù)字化呈現(xiàn),可以打破文化遺產(chǎn)與大眾之間的時空阻隔,讓更廣泛的大眾“細品”“研讀”,這樣會激發(fā)更多人到現(xiàn)場去“親眼看一看”的熱情。
早在20世紀90年代,敦煌研究院就提出了“數(shù)字敦煌”構(gòu)想,利用計算機技術(shù)和數(shù)字圖像技術(shù),推動實現(xiàn)敦煌石窟文物的永久保存、永續(xù)利用。經(jīng)過30多年的發(fā)展,敦煌研究院已完成230多個洞窟的數(shù)據(jù)采集以及大量彩塑的三維重建。
【圖源:數(shù)字敦煌官網(wǎng)】
此外,各大報道兩會的權(quán)威媒體也紛紛引入基于XR技術(shù)的AI虛擬主播,作為兩會新聞播報的重要補充。除了開頭提及的新華網(wǎng)AI虛擬主播,央視網(wǎng)也推出了AI虛擬助手“愛加(i+)”,對用戶的提問進行實時的問答,幫助用戶迅速掌握兩會要點。
事實上,AI虛擬主播作為融媒體的重要環(huán)節(jié)已經(jīng)日益普及,更是人工智能與新聞采編深度融合方面邁出的重要一步。
相芯科技作為業(yè)內(nèi)知名的XR內(nèi)容的創(chuàng)作和互動平臺,在AI虛擬主播方面也有所布局,提供互動直播、虛擬直播、虛擬主播和虛擬助手等多種解決方案,更搭建了專業(yè)版Web編輯系統(tǒng),用戶可以自主配置主播形象、播報背景、播報內(nèi)容,以打造適用的新聞播報場景。無論直接輸入播報文本,還是輸入主播錄音音頻,編輯系統(tǒng)都可以快速對內(nèi)容進行語音處理,并基于相芯科技自主研發(fā)的語音動畫合成(Speech to Animation)技術(shù)輸出播報視頻。
目前業(yè)內(nèi)已經(jīng)有大量融媒體中心采用了相芯科技的AI虛擬主播技術(shù),譬如廣視新聞的“小逸”、錢江臺與錢江視頻的“小范兒”,京東AI的“京小蕾”與“京小帥”,濟南廣電的“小沫兒”,揚子晚報的“阿紫”等等,無不成為所在融媒體的重要支柱。
除新聞播報外,AI虛擬主播在電商帶貨、娛樂直播、新聞播報、形象代言、IP打造等領(lǐng)域都大有用武之地。相芯科技也憑借技術(shù)穩(wěn)定、部署靈活的特點,讓VR/AR的應用門檻快速降低,在行業(yè)內(nèi)收獲了大批擁躉。
相芯科技致力于讓AI與傳統(tǒng)CG技術(shù)融合創(chuàng)新,打造XR內(nèi)容生產(chǎn)的基礎(chǔ)設(shè)施,賦能多用戶群體,覆蓋全場景3D內(nèi)容,以滿足高效內(nèi)容制作、虛擬IP打造、虛擬智能服務(wù)等多樣化需求,為影視游戲、社交娛樂、商務(wù)營銷、日常生活、智慧城市等場景提供一站式解決方案。
全球XR產(chǎn)業(yè)正從起步培育期向快速發(fā)展期邁進,我國直面同步參與國際技術(shù)產(chǎn)業(yè)創(chuàng)新的難得機遇。此次兩會著重提出發(fā)展VR和AR技術(shù),是加快數(shù)字化發(fā)展、打造數(shù)字經(jīng)濟新優(yōu)勢的重要舉措??梢灶A見,在未來的數(shù)字生態(tài)中,VR及AR產(chǎn)業(yè)將占據(jù)重要環(huán)節(jié)。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!