人工智能發(fā)展如火如荼,大模型的誕生風起云涌,不過雖然看到了很多大模型的發(fā)布,但還是很少能看到大模型的進步,讓人不由得懷疑大部分企業(yè)是不是只在跟風。
不過,剛剛發(fā)布一個月的訊飛星火大模型卻緊鑼密鼓地又召開了一次升級發(fā)布會,可以看出訊飛是真正在大模型時代發(fā)力狂奔,而這次發(fā)布的“訊飛星火認知大模型”V1.5甚至超越了上次發(fā)布會所承諾的更新速度,不僅在多種交互能力上實現(xiàn)了突破,在教育醫(yī)療等多個垂直領域也獲得了巨大進步。
高考題上見真章
這兩天恰逢高考,關于AI和高考的話題自然也就熱了起來。搜狐科技使用五款AI大模型對2023高考上海數(shù)學試卷的10道填空題進行了測試,結(jié)果科大訊飛星火認知大模型答對了5題,正確率50%。ChatGPT和百度文心一言都答對了4題,正確率40%。而阿里通義千問和360智腦則10道題全錯,正確率0%。
從這個結(jié)果上來看,上次訊飛發(fā)布會所說的訊飛星火大模型文本生成、數(shù)學能力已超過ChatGPT并非是吹牛。而在6月9號的發(fā)布會上,“訊飛星火認知大模型”V1.5重點呈現(xiàn)大模型在知識問答、數(shù)學能力、多輪交互中的升級,可以說AI能力又進一步,相信在領先幅度上又有加大。
所以無論從那個角度來看,訊飛都是在大模型領域做的最認真也是迭代速度更快的。我覺得大模型的競爭是一個分秒必爭的競爭,大家不僅各自在模型學習上永無止境,在算法和功能的落地體驗上,也要不斷的適配。大模型最終不會是一個聊天軟件,而是真正要形成生產(chǎn)力的AI發(fā)動機,從這個角度來說,在針對場景化的落地上,比如教育、醫(yī)療、應用適配方面,訊飛星火大模型確實還是走在前面的。
要知道,大模型最終的分界點還是要看誰能夠先實現(xiàn)“智慧涌現(xiàn)”,也就是一下子形成一個質(zhì)的飛躍和變化。這種跨越式的升級會一下子拉開各家之間的差距,就好像高中生高考進入大學一樣。并不是所有的大模型最終都能實現(xiàn)“智慧涌現(xiàn)”的,這可能也是最終判斷大模型是否能夠成功的關鍵。
能力升級,應用落地
在大模型的能力判斷上,行業(yè)其實還沒有統(tǒng)一標準,大部分測試也都相對局限,在這一點上,作為人工智能“國家隊”之一,科大訊飛被授予人工智能關鍵技術(shù)和應用評測工業(yè)和信息化部重點實驗室大模型工作組的副組長單位,參編中國信通院大模型標準體系2.0的建設,正在用我們自己的能力去構(gòu)建行業(yè)的標準。
而在后者的應用落地上,顯然這是訊飛最大的優(yōu)勢所在,無論是軟件還是硬件,現(xiàn)在都已經(jīng)有了成熟的產(chǎn)品應用,而在大模型產(chǎn)品的加持下,訊飛硬件產(chǎn)品在這次618大促上的表現(xiàn)也異常出色,大促開場不久就完成了去年全天的銷售額,訊飛AI學習機系列激活同比增長214%,訊飛智能辦公本系列激活同比增長176%,訊飛聽見網(wǎng)站新增用戶同比增長205%。
6月9日,是科大訊飛的24周年慶,而在這次的發(fā)布會上,訊飛星火認知大模型V1.5主要的升級核心有兩點,一個是訊飛星火大模型在能力上的升級,一個則是訊飛星火大模型在應用上的落地。訊飛星火認知大模型V1.5除了大模型本身能力的整體提升外,還在綜合能力上實現(xiàn)三大升級,包括:開放式知識問答取得突破,多輪對話、邏輯和數(shù)學能力再升級。
在現(xiàn)場,科大訊飛總裁吳曉如、研究院院長劉聰針對性的進行了測試,提出了諸如“2023年全國高考甲卷的作文題是什么,并分析一下它傳遞的意義。“ “高考剛剛結(jié)束,孩子即將開啟新的起點,請給你的孩子寫一封暖心的信。”這樣更為開放性的問題,以及“一條船上有三個人,但是有兩個父親,兩個兒子,請問是怎么回事?” “1個魚缸里有很多條魚,共有5個品種,至少要撈出多少條魚,才能保證其中有4條相同品種的魚?”這樣邏輯性和數(shù)學性兼顧的問題,都獲得了很好的回答。現(xiàn)場甚至還演示了拍照識別數(shù)學試卷,大模型準確答卷的測試,充分體現(xiàn)出了訊飛星火大模型V1.5的能力增強。
為了更好的服務用戶,在現(xiàn)場星火APP同步大模型發(fā)布,成為大模型的具體載體,而面向生活、工作等用戶高頻使用場景上線200+小助手,把AI落地做到了實處??拼笥嶏w還表示將進一步推動星火認知大模型在教育、醫(yī)療、工業(yè)、辦公等領域落地應用,賦能星火語伴APP、醫(yī)療診后康復管理平臺、羚羊工業(yè)互聯(lián)網(wǎng)平臺、訊飛聽見智慧屏等產(chǎn)品,并開放了訊飛星火開發(fā)接口,攜手開發(fā)者共建“星火”生態(tài)。
如果說五月份科大訊飛董事長劉慶峰表示“星火大模型距離ChatGPT差距不遠,有些地方甚至有所超越”還讓人覺得有點吹牛的成分,那么這次的展示顯然凸顯出了科大訊飛的底氣。劉慶峰表示,“今天我們再次如期發(fā)布星火大模型的最新成果,是因為我們所有的技術(shù)平臺都是完全自主研發(fā)的,我們對每一個階段的技術(shù)都是可控的,也非常有信心。訊飛不僅要致敬和追趕OpenAI,更要在源頭上做自主創(chuàng)新,在類腦智能、神經(jīng)網(wǎng)絡大模型、博弈智能等方面探索通用人工智能的更多潛在路徑和前沿交叉研究機會。”
自國內(nèi)大模型批量上市之后,很多人都會發(fā)現(xiàn)一個問題,就是感覺各大通用大模型似乎沒有太大差距,基本都能做到有問有答,但好玩之余似乎沒有什么地方能夠用到。即便是在海外,同樣的問題依舊存在,不少領域真正實用的大模型實際上并非通用大模型,而ChatGPT的各種產(chǎn)品落地,也并沒有帶來更為驚艷的用戶體驗,依舊還是一個加強版的搜索引擎。
所以,從這里我們可以看出,大模型的發(fā)展方向有兩個關鍵點,一個是“智慧涌現(xiàn)”的關鍵節(jié)點,一個是具體場景的落地應用。前者似乎有些不可預測,但后者則是完全可以嘗試領先一步的。畢竟,我國的科技行業(yè)一直在應用端有著無可比擬的優(yōu)勢,率先在應用端實現(xiàn)領先突破似乎是逆襲ChatGPT的關鍵路徑。
科大訊飛一早就建立了認知大模型“1+N”專項攻關的體系,其中“1”就是通用的認知智能大模型,“N”就是將“訊飛星火”在教育、辦公、汽車、人機交互、醫(yī)療等領域進行應用落地。而這次訊飛星火認知大模型V1.5更進一步拓寬了對“N”個行業(yè)領域的賦能。
比如AI口語助手升級的星火語伴APP,已經(jīng)可以像外語口語老師一樣進行開放式對話、情景交流,并進行實時口語糾錯,配合虛擬老師形象,可以讓用戶可以身臨其境的練習口語,并支持9種語言文本、語音和圖片翻譯。
在辦公領域,科大訊飛發(fā)布了業(yè)界首個搭載大模型的會議室智能終端——訊飛聽見智慧屏。它可以實現(xiàn)動態(tài)會議記錄、會議內(nèi)容自動整理輸出,一鍵生成多種類型的會議文案,助力用戶高效辦公。
在醫(yī)療方面,訊飛醫(yī)療全面升級醫(yī)療診后康復管理平臺,將專業(yè)的診后管理和康復指導延伸到院外,可以根據(jù)患者健康畫像自動分析,平臺可為患者智能生成個性化康復計劃,包括重點關注、用藥指導、康復運動、出院隨訪、健康知識、患者咨詢等,并督促患者按計劃執(zhí)行。
在工業(yè)領域,在星火大模型的基礎上,羚羊平臺推出了工業(yè)AI——“羚機一動”。中小企業(yè)在羚羊平臺上自由發(fā)布需求,羚機一動針對企業(yè)需求給出專業(yè)化建議策略,智能匹配方案、服務商、專家等資源,等等??梢哉f,訊飛星火大模型正如其名稱一樣,真正地已經(jīng)在各個領域開始星火燎原了。
劉慶峰在現(xiàn)場宣布,訊飛將開放星火認知大模型開發(fā)接口,將七大維度能力、200+小助手對應能力全面開放給開發(fā)者,并且支持多端接入快速集成,支持私有化部署,與廣大開發(fā)者共建生態(tài)。他表示:“通用人工智能的全新時代將是一個偉大的歷史進程,絕不是一蹴而就的,所以我們既要有短期攻關的雄心,更要有長期主義的恒心。這是我們應該遵循的產(chǎn)業(yè)邏輯和科研發(fā)展應有的規(guī)律,這樣才能夠在長跑中真正勝出,真正的解決社會剛需,建設美好世界。”
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!