如果沒有開源,就沒有Linux、PHP、MySQL,也就沒有中國的數(shù)據(jù)庫和互聯(lián)網(wǎng);如果沒有Transformer的開源,也就不會有OPEN AI和ChatGPT。但正因?yàn)橛辛碎_源,才會出現(xiàn)AI同質(zhì)化,也就將導(dǎo)致MaaS(模型即服務(wù))不稀缺,進(jìn)而導(dǎo)致@百融云-W(6608.HK)們即將面臨價(jià)格戰(zhàn)?但,這是事實(shí)嗎?
以上觀點(diǎn)刻舟求劍、完全錯(cuò)誤,因?yàn)閭鹘y(tǒng)IT開源的是全部源代碼,但AI大模型不會開源訓(xùn)練過程和訓(xùn)練數(shù)據(jù)。而語料的缺失,正是中國AI公司想爭奪MaaS業(yè)務(wù)和B端市場但又缺乏競爭壁壘的關(guān)鍵。
曾經(jīng)的“LAMP”棧:Linux是開源的操作系統(tǒng)內(nèi)核,開放源代碼與開發(fā)者社區(qū),后世的安卓系統(tǒng)便脫殼于此;Apache HTTP Server是一個(gè)Web服務(wù)器軟件,處理HTTP請求并提供Web頁面;PHP是開源的服務(wù)器端腳本語言;MySQL是開源關(guān)系數(shù)據(jù)庫管理系統(tǒng)(RDBMS),用于網(wǎng)站和在線應(yīng)用的數(shù)據(jù)存儲,共同構(gòu)成了互聯(lián)網(wǎng)世界的基座。但早在AI時(shí)代到來之前,云計(jì)算時(shí)期的開源就已經(jīng)發(fā)生了變化。
核心原因,就在于——“商業(yè)化”,也就是科技公司開始利用開源做生意。
彼時(shí)的云服務(wù)商通過大量采用和貢獻(xiàn)開源技術(shù),如OpenStack、Docker,將開源軟件與云服務(wù)緊密結(jié)合,通過提供基于開源軟件的云服務(wù)來創(chuàng)造商業(yè)價(jià)值,如AWS、Azure等。而到了現(xiàn)在的AI時(shí)代:OpenAI已不再Open。
AI大模型的開源戰(zhàn)場,交給了Meta、Llama這些AI大模型,但Llama2并不符合開放源代碼促進(jìn)會(OSI)設(shè)定的定義,比如禁止使用Llama2去訓(xùn)練其它AI模型以及如果該模型用于每月用戶超過7億的應(yīng)用程序和服務(wù),則需要獲得Meta的特殊許可證。
作為中國MaaS的頭部玩家,百融云曾經(jīng)也一度擔(dān)憂開源AI帶來的競爭壓力,但事實(shí)上,開源AI除了訓(xùn)練許可之外,商業(yè)化領(lǐng)域最大的痛點(diǎn)還在后面。
首先是開源的方式,Llama的開源方式是指在開放源代碼的同時(shí),對使用、修改和分發(fā)該模型的行為施加一定的限制。這與完全開放的開源許可證不同,后者通常允許用戶在幾乎不設(shè)限的情況下使用和修改軟件。雖然Mistral、谷歌的開源AI模型Gemma,同時(shí)開源了模型的權(quán)重和架構(gòu),但是對于AI模型訓(xùn)練的數(shù)據(jù)和訓(xùn)練過程并不開源。
這兩項(xiàng),恰恰就是MaaS模式已經(jīng)出現(xiàn),但玩家少之又少的原因。因?yàn)闆]有Fine-tune和垂直領(lǐng)域私有化數(shù)據(jù)訓(xùn)練的AI模型,是沒有任何商業(yè)化可能性的。
百融云MaaS業(yè)務(wù)的主要戰(zhàn)場是金融業(yè),作為中國六大基石產(chǎn)業(yè)之一,中國金融機(jī)構(gòu)是不可能允許將數(shù)據(jù)用于訓(xùn)練開源AI模型的,尤其是來自海外的開源AI。
金融機(jī)構(gòu)對于MaaS服務(wù)的使用,第一層是單次使用直接得到信息輸出(Equivalent模式);第二層是基于現(xiàn)有搜索引擎,AI通過對實(shí)時(shí)信息的智能檢索和分析,經(jīng)過加工后再生成信息反饋(2-Stage Search Summarizer模式)。所以中國的金融機(jī)構(gòu)需要不停的在業(yè)務(wù)流程中調(diào)取實(shí)時(shí)信息,并且依賴百融云MaaS服務(wù)的擴(kuò)展能力,假定AI模型會檢索傳統(tǒng)搜索引擎中的相關(guān)內(nèi)容,并基于每條搜索內(nèi)容生成結(jié)果響應(yīng),如貸款申請?jiān)u分、財(cái)富管理產(chǎn)品推薦等等,并將模型認(rèn)為最好的答案輸出給用戶,50 tokens的信息輸入條件下,每次基于傳統(tǒng)搜索引擎生成10個(gè)響應(yīng),每個(gè)響應(yīng)中有平均1000 tokens,并最終生成400 tokens的搜索結(jié)果。
舉一個(gè)MaaS在財(cái)富管理的實(shí)際應(yīng)用,一位客戶提出了“有5萬元可供投資”的需求,百融云的MaaS服務(wù)就會調(diào)用所有的AI模型庫,其訓(xùn)練數(shù)據(jù)來自金融機(jī)構(gòu)的產(chǎn)品中心、客戶中心、賬戶核心、風(fēng)控、商戶、運(yùn)營管理等不同的業(yè)務(wù)部門,最終形成的MaaS業(yè)務(wù)調(diào)用結(jié)果就會是:“您的投資風(fēng)格是穩(wěn)健型,您是我行尊貴的鉑金客戶,我行目前有平均年化收益3%的理財(cái)產(chǎn)品,起投金額正是5萬……”。
中國企業(yè)用戶從來要的就不是AI大模型,而是能幫助用戶創(chuàng)收的AI解決方案,可以是AI產(chǎn)品,也可以是AI服務(wù)。但很明顯,上述百融云MaaS業(yè)務(wù)的案例,是所有開源AI模型無法實(shí)現(xiàn)的。
因?yàn)闊o法獲得垂直領(lǐng)域訓(xùn)練數(shù)據(jù)的開源AI,與不能變現(xiàn)的小程序沒區(qū)別。
百融云MaaS業(yè)務(wù)在2023年實(shí)現(xiàn)收入8.91億、同比增幅17%、且有99%的核心客戶留存率。如果開源AI模型能取代百融云的地位,或許客戶早就更換AI服務(wù)商了,因?yàn)樵赟caling law法則下,就算開源具備私有化部署的成本優(yōu)勢,也彌補(bǔ)不了無法商業(yè)化的劣勢。
百融云們,似乎之前也高估了開源AI的威脅。換言之,開源AI上不了中國商業(yè)化的高端局。
目前百融云的MaaS收入僅僅相對于金融機(jī)構(gòu)信貸總額的萬分之幾,中國消費(fèi)信貸這么大的市場,即使成為千分之一的體量,百融云要面對的也將是幾百億規(guī)模的普惠金融AI市場。現(xiàn)在便開始展望天花板,未免早了些。
申請創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!