落地為王階段,在算力、平臺、模型、應用、生態(tài)等方面,都有持續(xù)深入的企業(yè),對產(chǎn)業(yè)來說有更強的吸引力。
作者|劉珊珊
編輯|楊 銘
轟轟烈烈大模型,走到市場化大規(guī)模落地前夜。
8月15日,《生成式人工智能服務管理暫行辦法》施行。這是我國第一部AIGC管理辦法,明確行業(yè)健康、安全、規(guī)范同時,進一步促進生成式人工智能應用的加速落地。
這被解讀為,在國內(nèi)已經(jīng)打響半年,熱度空前的“千模大戰(zhàn)”迎來關鍵戰(zhàn)場節(jié)點,正式進入應用PK、“落地為王”階段。
硝煙背后,業(yè)界與大眾普遍關心話題是:當大模型逐漸變成一種基礎能力,如何進行技術上的迭代升級?又如何與更多行業(yè)結合,提速規(guī)?;?、商業(yè)化進程,在競賽長跑中占據(jù)領先地位?
這考驗著入局者的智慧,亦決定入局者未來命運走勢。
“通用人工智能絕不僅僅是單個企業(yè)、單個科研院所的使命,而是整個社會的機會,大模型賦能個體和行業(yè)的大未來正在到來。”8月15日,長達140多分鐘的訊飛星火認知大模型V2.0升級發(fā)布會上,身著傳統(tǒng)黑西褲、白襯衫的科大訊飛董事長劉慶峰說。
這是科大訊飛大模型又一次重要亮相——自5月6日對外正式展示至今,訊飛星火認知大模型剛好100天,期間經(jīng)歷了V1.5的迭代。
當前V2.0 升級,是在提升通用能力基礎上,重點突破代碼能力和多模態(tài)能力。根據(jù)劉慶峰的說法,代碼能力是支撐認知大模型智慧的關鍵維度,多模態(tài)能力則是實現(xiàn)通用人工智能的必經(jīng)之路。
這些能力,已同步在iFlyCode1.0(編程助手)、訊飛智作2.0(視頻創(chuàng)作平臺)、星火語伴2.0(練習口語)等應用和產(chǎn)品上,成為科大訊飛大模型落地應用和商業(yè)化上的重要一步。
從技術能力來看,訊飛星火V1.5Python語言效果只有41分,V2.0已有61分,接近ChatGPT。根據(jù)計劃,到今年10月24日,訊飛星火各個代碼緯度能力將比ChatGPT,實現(xiàn)中文超越、英文相當?shù)乃?,到明年上半年對標GPT-4。
這意味著,伴隨大模型進入“落地為王”的中場戰(zhàn)事階段,中國大模型也將迎來自己的領先時刻。
01大模型落地,從產(chǎn)業(yè)開始
命運齒輪,轉動于5月6日。彼時科大訊飛躬身入局,發(fā)布星火認知大模型1.0版本。
短短幾個月,大模型已在國內(nèi)掀起一場場“肉搏戰(zhàn)”。通用、行業(yè)、垂直、開源和閉源等不同類型大模型,基于GPT,就像樹干上的枝丫一樣,瘋狂開枝散葉?;ヂ?lián)網(wǎng)、人工智能巨頭、創(chuàng)業(yè)公司、各類型中小企業(yè)、研究機構入局者數(shù)不勝數(shù),幾乎每天都有不同類型大模型推出。
比如,10億級參數(shù)規(guī)模大模型——參數(shù)量被默認為通用大模型、垂直和行業(yè)模型區(qū)別重要因素。規(guī)模參數(shù)越高,對算力、數(shù)據(jù)、資源、技術要求就更高,但在國內(nèi),10億級參數(shù)以上多模態(tài)大模型卻超80個。
這并不意味著賽道的真正崛起。在國內(nèi),投資者逐漸趨冷,部分入局者黯然離場;在國外,ChatGPT誕生9個月花費近2億美元,高昂成本讓OpenAI有“破產(chǎn)風險”。
盲目燒錢不可持續(xù),大模型成本、商業(yè)化落地兩大難題,讓大眾開始重新審視,大模型的經(jīng)濟和社會價值。
各界“到底需要什么大模型”探討中,深耕行業(yè),與生態(tài)結合,讓大模型在不同行業(yè)、不同類型企業(yè)發(fā)揮生產(chǎn)力作用,成為解決大模型難題,真正產(chǎn)生價值行業(yè)共識。
“誰能在具備社會剛需的應用場景落地,誰就能最先形成自我造血的良性循環(huán)。”劉慶峰明確斷言。在他看來,對科大訊飛這樣體量的公司,不做通用大模型就不可能在國際舞臺上未來爭得一席之地,連上桌機會都沒有。
通用還是垂直選擇題上,每家企業(yè)都有自己理由和抉擇。多模態(tài)通用大模型,被業(yè)界視為“綜合大學學生”,可能在某些垂類領域沉淀數(shù)據(jù)有所不足,卻是各個行業(yè)通向智能化、通用化必由之路,也是業(yè)界公認事實。
事實上,應用落地才是衡量一切大模型價值最高標準。最大難題是,如何搞懂行業(yè)、每個客戶需求,以及應用安全、易用,具備產(chǎn)業(yè)價值。
行業(yè)場景分為政府及大型企業(yè)(ToB、ToG)、個人(ToC)、中小企業(yè)(ToSME)等不同類型。不同行業(yè)與大模型結合本質邏輯不同,如ToB、ToG,往往要求邏輯復雜定制化場景中,必須做到可控、可追溯、可修正。ToSME同樣有定制化需求,但降本增效,給企業(yè)帶來增長價值,卻是衡量關鍵。
多位觀察人士認為,深入行業(yè)Know-how基礎上,和大模型能力融合,是大模型產(chǎn)業(yè)化最有效路徑。
劉慶峰認為,其前提是,要在國產(chǎn)算力安全和數(shù)據(jù)安全下,回歸場景驅動。“場景給客戶帶來的價值是什么,新增效益,還是節(jié)約成本、提高質量,同時能夠讓用戶快速地、低技術門檻訓練,才能夠使它賦能千行百業(yè)。”
這是科大訊飛在8月15日推出星火一體機重要原因——其與華為昇騰AI聯(lián)合研發(fā),意在為每一家企業(yè)提供專屬的大模型,適合有數(shù)據(jù)安全需求的大型客戶。
“開箱即使用,提供從底層算力、AI 框架、訓練算法、推理能力、應用成效等全棧 AI 能力。”劉慶峰稱。
對科大訊飛來說,TOB端探索出的大模型賦能路徑是,在研、產(chǎn)、供、銷、服、管等各維度賦能。例如,大模型掌握行業(yè)基本能力、通用知識后,結合企業(yè)專屬知識庫,讓新員工也能迅速掌握經(jīng)驗和知識,大幅提升工作效率。
不止科大訊飛,百度、騰訊、阿里、360都試圖通過為企業(yè)提供專屬大模型,加快產(chǎn)業(yè)融合、落地速度。“落地為王階段后,淘汰賽就會一觸即發(fā)。”多位觀察人士判斷。
必須意識到,受制于數(shù)據(jù)、算力、場景等限制,真正能跑通大模型商業(yè)化的入局者,數(shù)量將不會太多。其一,大模型仍會像互聯(lián)網(wǎng)、人工智能、云計算一樣,以互聯(lián)網(wǎng)、科技大廠為主導;其二,大廠不會局限于泛通用行業(yè),而是“大模型+業(yè)務”深入垂類,走通用+垂類“并行”路徑。
比如科大訊飛,星火是多模態(tài)通用大模型,卻早已開枝散葉,應用在教育、醫(yī)療、辦公、數(shù)字員工、汽車、金融、工業(yè)等多垂類場景。
02千模大戰(zhàn),訊飛星火憑啥第一?
當前,賽道各大玩家紛紛結合自身已有業(yè)務場景,試圖在大模型釋放更大價值前,搶占戰(zhàn)場制高點。
但客觀來看,科大訊飛目前是脫穎而出,走得最快的那個。
這從科大訊飛最新財報,大模型加持后的商業(yè)化增長,得到印證。今年上半年,教育、開放平臺及消費者、智慧汽車、智慧醫(yī)療、智慧金融等業(yè)務收入分別為22.9億元、24.2億元、2.1億元、1.9億元、0.9億元,分別同比增長3.63%、21.6%、26.14%、37.13%和22.19%。
"可以看到,大模型正實實在在推動產(chǎn)業(yè)前進。" 劉慶峰稱。
這也讓外界頗為疑惑:ChatGPT都遭遇變現(xiàn)難題時,科大訊飛為何領先業(yè)界,先一步嘗到大模型的商業(yè)化甜頭?
有人工智能從業(yè)人士對“極點商業(yè)”稱,大模型應用落地,其實是一條技術—產(chǎn)品—場景—規(guī)?;难葑兟窂?。“就像一個木桶,不能存在短板,才有成功接受市場考驗可能。”
大模型并非短期內(nèi)一蹴而就,而是長期技術沉淀下所推動。1999年成立的科大訊飛,24年來在劉慶峰博士帶領下,一直是人工智能領頭羊形象存在,在深度學習算法、行業(yè)大數(shù)據(jù)、知識圖譜、多模態(tài)感知、系統(tǒng)工程等技術方面有著深厚積累。
外界未曾關注到的是,其在認知大模型上也有近十年沉淀。2014年,科大訊飛啟動“訊飛超腦”計劃,實現(xiàn)機器從“能聽會說到能理解會思考”。到2022年,累計摘取16項國際人工智能大賽的冠軍,其中認知智能領域有13項冠軍。
這離不開研發(fā)的持續(xù)投入。2022年,科大訊飛總研發(fā)投入33.6億元,研發(fā)人員數(shù)量占公司總人數(shù)的比例為約60%。而根據(jù)最新財報,科大訊飛上半年研發(fā)支出16.6億元,同比去年同期16億元增加大約3.8%。這是星火認知大模型短時間內(nèi)多次重要升級關鍵。
研發(fā)投入、技術領先帶來的,是在G/B/C端應用場景不斷拓展,占據(jù)更多用戶心智。根據(jù)IDC《中國人工智能軟件2022年市場份額》,在語音語義AI市場,科大訊飛位于榜首,持續(xù)領先百度智能云、阿里云。
長達20年多年的技術沉淀,讓科大訊飛在大模型的打造上,有了“所有技術平臺完全自主研發(fā),每一階段技術都可控”的底氣。
比如,在大模型多個關鍵技術,多家權威評測就將訊飛火星排在了第一位。
根據(jù)新華社研究院中國企業(yè)發(fā)展研究中心發(fā)布《人工智能大模型體驗報告2.0》(以下簡稱《報告》),訊飛星火以總分1013分位列本次國產(chǎn)主流大模型測評榜首位,超過商湯商量、通義千問等大模型,在四大評測維度中的智商指數(shù)、工具提效指數(shù)兩個維度獲得第一。
IT之家評測中,在完善度、功能性、易用性等維度,訊飛星火同樣超過文心一言、通義千問、360智腦,排在第一。
《麻省理工科技評論》則將訊飛星火稱為“最聰明”的大模型。在8個一級大類的600道題目的測試和盲評中,訊飛星火認知大模型V2.0在編程能力、理科綜合、邏輯思維、數(shù)學專項、語言專項和綜合知識6個大類中得分率排名第一,超過文心一言、商湯商量、通義千問,獲得“最聰明”的國產(chǎn)大模型稱號。
商業(yè)化探索上,有別大多數(shù)大模型,科大訊飛采取的是“技術能力+落地應用”并行策略。
一個細節(jié)是,科大訊飛在5月6日推出訊飛星火時,盡管發(fā)布時間并不領先,卻在現(xiàn)場明確了教育、醫(yī)療、金融、辦公、汽車、工業(yè)六個行業(yè)的應用場景。
此后兩次升級,也有明確加速上述行業(yè)探索邊界,推進其規(guī)模化應用落地和產(chǎn)業(yè)生態(tài)的構建——值得一提的是,科大訊飛是第一個在發(fā)布時,即明確階段性升級時間,并同步生態(tài)應用規(guī)劃的企業(yè)。
另外,LUMIE 10系列、智能辦公本X3等與訊飛星火結合的硬件產(chǎn)品,在展示技術能力時,也同步落地上市。
“不僅要做基礎通用大模型,還要同步做落地教育、醫(yī)療、辦公場景的產(chǎn)品應用。”今年4月,科大訊飛副總裁、研究院執(zhí)行院長劉聰曾透露,為進一步提高大模型細分行業(yè)的實用性,科大訊飛實行了“1+N”攻關體系。其中,“1”是通用認知智能大模型算法研發(fā)及高效訓練底座平臺,“N”則是應用于教育、醫(yī)療、人機交互、辦公等多個行業(yè)領域的專用大模型版本。
“‘1’ 的能力融入到 ‘N’ 的產(chǎn)品應用中,‘N’ 的數(shù)據(jù)和場景更新到 ‘1’ 里迭代能力,構建一個循環(huán)的系統(tǒng)性工程。”劉聰說,訊飛大模型的技術、產(chǎn)品與服務,一直是圍繞產(chǎn)業(yè)應用場景來展開。
因此,外界也得以在短短三個月內(nèi),就清晰看到了科大訊飛大模型,在C端和B/G端的齊頭并進。
C端,科大訊飛消費者產(chǎn)品覆蓋AI辦公、AI學習、AI健康三大賽道,是國內(nèi)AI應用產(chǎn)品最豐富的企業(yè)。
其中在AI學習賽道,僅僅是5-6月,科大訊飛AI學習機GMV就分別同比增長136%和217%;訊飛AI硬件在今年6.18獲得京東和天貓雙平臺7類銷售冠軍。
當前AI學習機為代表的智能學習硬件市場強敵林立、同質化嚴重,是各路巨頭都看上的市場,包括小度、步步高、猿輔導、作業(yè)幫、讀書郎等新老玩家齊聚??拼笥嶏w利用AI大模型能力,是其差異化突圍關鍵。
B/G端,作為AI“國家隊”,科大訊飛已在政務、電力、醫(yī)療、工業(yè)、司法、金融等行業(yè)深耕多年。
金融領域,訊飛和人??萍嫉冗_成合作,推進大模型技術在金融垂直領域的應用;工業(yè)領域,星火大模型搭載在羚羊工業(yè)互聯(lián)網(wǎng)平臺,智能匹配方案、服務商、專家等資源,實現(xiàn)供需匹配;醫(yī)療領域,訊飛診后康復管理平臺基于大模型技術進行了升級,與北京協(xié)和醫(yī)院、四川華西醫(yī)院等多所醫(yī)院進行合作,覆蓋20多個科室的主要病種。
在8月15日的發(fā)布會上,劉慶峰強調說,訊飛星火已完成金融、政務、汽車等領域9個專屬大模型數(shù)據(jù)顯示,在場景任務優(yōu)化、私域知識增強等方面增效20%。
03競賽馬拉松,科大訊飛如何走更遠
大模型競賽是一場馬拉松,當下大模型仍然處于一個技術不斷迭代、培育市場、搶占用戶心智階段。
這意味著,眼前領跑之外,更重要的是未來如何走得更遠。
對于未來,科大訊飛從未掩飾它的“野心”,在5月推出訊飛星火時,就成為國內(nèi)首家明確公布時間表的企業(yè):今年10月24日,訊飛星火代碼各維度能力將超越ChatGPT,明年上半年對標GPT-4。
此前,因為種種原因,幾乎所有國內(nèi)大模型都被外界認為,在技術、算法、可應用性上和ChatGPT存在差距。顯然,在算力、算法等底層能力上保持迭代優(yōu)化,并和產(chǎn)業(yè)應用緊密結合,是科大訊飛能否實現(xiàn)上述目標的保障。
“對代碼能力的邏輯、算法、方法、體系、數(shù)據(jù)準備已經(jīng)全部就緒,所需要的就是時間和算力。”劉慶峰稱。
技術永無止境。多次迭代后,訊飛星火大模型核心能力、應用和產(chǎn)品正不斷擴容。比如此次訊飛星火2.0,科大訊飛就對代碼能力進行5個維度的升級,包括:代碼生成、代碼補齊、代碼糾錯、代碼解釋、單元測試生成。
圖像描述、圖像問答、識圖創(chuàng)作、文圖生成、虛擬人合成等多模態(tài)能力方面,訊飛星火大模型也全面升級。在代碼能力和多模態(tài)能力迭代基礎上,科大訊飛推出了能夠進行視頻創(chuàng)作的訊飛智作2.0、“智能編程助手iFlyCode2.0”、一鍵生成課件星火教師助手等,作為AIGC內(nèi)容的生產(chǎn)工具。
代碼能力和多模態(tài)能力升級,意味著幫助專業(yè)程序員提升效率,創(chuàng)造更大價值。
從演示來看,借助iFlyCode1.0工具,簡單幾步Prompt完iFlyCode界面后,一行代碼都不用寫,就可以馬上實現(xiàn)“凌空手寫”功能。以前,經(jīng)驗豐富的工程師要半天到1天才能完成,現(xiàn)在只需要幾分鐘。
過去一個月,iFlyCode在訊飛內(nèi)部有2000多名員工實現(xiàn)試點應用,代碼采樣率超過30%,編碼效率提升30%以上,綜合工作效率提升15%,能明顯感受到大模型帶來的效率提升。
此外,哪怕不是編程高手的普通人,只要發(fā)揮想象力、基于對應用場景的認知,也可以“零門檻”進入代碼世界。
例如,使用Python畫紅色的心形線、用代碼生成“貪吃蛇”等小游戲、利用小視頻做表情包等需求,訊飛星火都能迅速完成。
此前,科大訊飛已將星火大模型的能力,包裝為中英文類人批改、英語類人口語對話等諸多應用場景,置入進T20、LUMIE 10、T10等AI學習機產(chǎn)品。有經(jīng)銷商表示,用戶對搭載星火大模型的旗艦產(chǎn)品,熱情度非常高。
升級后的星火大模型,圍繞教育落地多款產(chǎn)品和功能。星火教師助手應用在訊飛教育數(shù)字基座上,零編程基礎的老師也能使用,并滿足學校管理數(shù)字化轉型中的個性需求和定制開發(fā)。AI 智能編程助手和 AI 創(chuàng)意繪畫伙伴的推出,標志著大模型對AI學習機賦能,更全面貼近新課標的要求。
代碼和多模態(tài)能力的升級,也是大模型降低門檻,解放生產(chǎn)力,釋放想象力的關鍵。目前,結合原有應用數(shù)據(jù)和場景描述,集成訊飛星火的代碼能力和語言理解能力,大大提升學校開發(fā)效率:原有開發(fā)應用周期從17天縮短至1天,投資成本由15萬降低至1.5萬元。根據(jù)科大訊飛透露,該教育數(shù)字基座已經(jīng)在上海、湖北、安徽的一些學校試點落地。
產(chǎn)業(yè)生態(tài)上,為行業(yè)、政務提供業(yè)界領先、自主可控的私有化代碼能力平臺——比如星火一體機。另外,開發(fā)者生態(tài)也是大模型產(chǎn)業(yè)良性循環(huán)關鍵。
5月6日星火大模型發(fā)布后兩個月內(nèi),訊飛人工智能開放平臺開發(fā)者數(shù)量增加了85萬家。6月9日以來,已有4000余個助手開發(fā)者團隊加入進來,開發(fā)出了7800多個助手。
隨著生態(tài)集中,大模型不僅與產(chǎn)業(yè)應用更緊密,加快賦能千行百業(yè)進程,也能通過正向反饋,促進基礎研究和關鍵技術的自主迭代,更大程度解放生產(chǎn)力,釋放想象力。
科大訊飛就表示,當前多模態(tài)能力已廣泛應用在教育、醫(yī)療、工業(yè)、汽車、機器人等領域。真實世界獲得的數(shù)據(jù),將提升產(chǎn)品終端的學習、訓練,從而推出更自主的工業(yè)機器人、更好的自動駕駛、走入家庭的陪伴機器人等等。
“這會是一個長期過程。在算力、平臺、模型、應用、生態(tài)等方面,都有持續(xù)深入的企業(yè),對產(chǎn)業(yè)來說有更強的吸引力。”一位人工智能分析人士說。
寫在最后:
大模型落地道阻且長??傮w而言,當前大模型尚未完全離開“喧囂”,各行各業(yè)大多處于賦能階段,想收獲大規(guī)模產(chǎn)業(yè)價值,還有很長的路要探索。
如同比爾·蓋茨在《人工智能時代已經(jīng)開啟》中所描述,自1980年圖形用戶界面出現(xiàn)以來,大模型是所見過最具革命性的技術進步。一場事關所有產(chǎn)業(yè)的商業(yè)變革,已經(jīng)拉開了大幕。
通過技術、產(chǎn)品、應用深耕,訊飛星火大模型“長坡厚雪”,正率先走向產(chǎn)業(yè)深處。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!