1. 創(chuàng)業(yè)頭條
  2. 前沿領域
  3. AI智能
  4. 正文

生產力工具中的“六邊形戰(zhàn)士”:解密海螺AI“紅海突圍”的底氣

 2024-05-24 17:04  來源:A5專欄  我來投稿 撤稿糾錯

  域名預訂/競價,好“米”不錯過

2023年可以說是人工智能行業(yè)最振奮的一年,大模型的能力每隔一段時間就會上一個新臺階,洶涌澎湃的技術革命迅速影響著每一個人的生活,AGI不再是一種技術理想,而是觸手可及的現(xiàn)實。

到了2024年,人工智能的熱度不減,但口口相傳的“百模大戰(zhàn)”并未上演。資本市場罕見地“降溫”,不少大模型悄無聲息地消失,有機會進入決賽圈的大模型創(chuàng)業(yè)者,僅剩下寥寥數(shù)家。

其中就有孵化出海螺AI的MiniMax,一家不為太多人所熟知,估值卻早已超過25億美元的現(xiàn)象級獨角獸。

01 技術路線幾乎沒有退路

目前國內估值超過10億美元的大模型創(chuàng)業(yè)團隊只有五六家,MiniMax恰恰又是其中最為特殊的存在:

1、月之暗面、百川智能、零一萬物等均成立于2023年,MiniMax卻是一家誕生于2021年的企業(yè),比友商們早了兩年時間。

2、有別于李開復、王小川等人的“明星”身份和高調風格,MiniMax的創(chuàng)始人閆俊杰不可謂不低調,很少在公開場合露面。

3、“搶算力”儼然是整個AI行業(yè)的常態(tài),MiniMax沒有夠購買任何GPU,而是以相對便宜的價格找火山引擎租了大量GPU算力。

為何特立獨行的MiniMax能夠活下來?答案就藏在閆俊杰時常提及的一句話里:“我選的技術路線幾乎沒有退路”。

直接的例子就是MoE(混合專家模型)上的“豪賭”。

時間回到2023年夏天,國內的大模型廠商們紛紛加快了研發(fā)進度,擺在MiniMax面前的現(xiàn)實問題是:自家2B和2C的產品已經(jīng)有很多用戶,傳統(tǒng)dense(稠密)模型生成token的成本太高,延時太嚴重;在計算資源有限的情況下,只有MoE才能訓練完當時的數(shù)據(jù)。

理論上講,MoE相較于dense模型的預訓練速度更快,在相同參數(shù)的情況下,有著更快的推理速度,但在微調方面存在諸多挑戰(zhàn),比如泛化能力不足容易引發(fā)過擬合現(xiàn)象,屬于典型的“技術派才有的紅利”。

其他廠商選擇dense模型快速迭代的時候,MiniMax放了80%以上的算力和研發(fā)資源做MoE,而且沒有Plan B。

拐點出現(xiàn)在2024年初,MiniMax發(fā)布了國內首個基于MoE架構的abab 6,找到了越來越多加速實現(xiàn)Scaling Laws的途徑,包括改進模型架構、重構數(shù)據(jù)pipeline等等,并在三個月后研發(fā)出了更強大的abab 6.5。

正如外界所熟知的,長文本能力在2024年成為生產力工具的“勝負手”,萬億參數(shù)的abab 6.5已經(jīng)200k tokens 的上下文長度,綜合能力已經(jīng)不遜于國外主流大模型;使用同樣的訓練技術和數(shù)據(jù)的abab 6.5s,進一步提升了推理速度,可以在1秒內處理近3萬字的文本。

按照業(yè)界常用的“大海撈針”機制,即在很長的文本中放入一個和該文本無關的句子(針),然后通過自然語言提問模型,看模型是否準確將這個針回答出來。在891次問答中,abab 6.5均能正確回答。

現(xiàn)在,MoE模型已經(jīng)上升為行業(yè)共識,被認為是高性能AI大模型的必選項,而MiniMax已經(jīng)在這條路上“搶跑”了一年。

02 技術驅動的產品方法論

讓許多人沒想到的是,一群癡迷于技術的工程師,“意外”做出了多個日活用戶超過100萬的產品,包括Glow、星野、海螺AI等,涵蓋內容社區(qū)、生產力工具等不同方向。

曾有媒體在采訪時詢問閆俊杰:“你們第一個模型還沒做出來,就招了產品經(jīng)理,當時你如何向他描述你想要一個怎樣的產品?”出乎預料的是,閆俊杰給出的回答只要三個字:“不知道。”

閆俊杰口中的“不知道”,源于對技術的敬畏:當前AI原生的超級產品,無不源自突破性的技術進步。

比如搜索問答幾乎是所有對話式AI的標配,也是我們使用生產力工具提升工作效率的剛需功能。但越是基礎的功能,越能驗證生產力工具的價值,考驗背后大模型的能力。

百度發(fā)布2024年Q1財報后,我們同時在海螺AI和國外的一款產品進行了對比,用戶體驗可謂高下立見:

海螺AI整理出了百度的核心業(yè)務信息,包括營收、利潤等關鍵數(shù)據(jù),以及百度智能云、開發(fā)者社區(qū)、百度APP、蘿卜快快等核心業(yè)務數(shù)據(jù),有著清晰的邏輯和側重,并且每條內容都關聯(lián)了對應的信息源,甚至在末尾附加了和百度財報相關的常見問題。

另一款產品也準確回答了財報的核心信息,但僅僅引述了一些媒體報道,輸出內容的結構化很弱,需要人工二次處理信息。和直接用搜索引擎查找信息的方式相比,并未節(jié)省太多的時間。

再比如長尾內容的檢索和生成能力。像百度財報這樣的熱門議題,很容易找到相關的媒體報道,一些小眾的長尾內容,似乎更能考驗生產力工具的內容檢索和生成能力。

我們的問題是皮爾斯·布朗的代表作《火星崛起》,曾被《娛樂周刊》評為2014年度最佳圖書,但知名度不如《火星救援》、《星球崛起》等可能被AI混淆的名著。海螺AI準確理解了我們的需求,生成的故事梗概可圈可點,并給出了深刻的評價;豆包將我們的需求誤解為《星球崛起》,生成的內容居然是《火星三部曲》的介紹。

技術的上限左右著產品的上限。

MiniMax之所以做出了海螺AI這樣“能打”的生產力工具,根源在于技術驅動的產品方法論,只有具備足夠好的產品能力,才能承接和轉化取得的技術進展,否則會落得一場空。

當然,MiniMax也有自己的“野心”。就像閆俊杰所籌劃的:“在技術快速進化的窗口關閉前,做出用戶量巨大的To C產品。”

03 做普通人每天用的產品

資本圈里流傳著一句話:判斷一位人工智能創(chuàng)業(yè)者是否真正的AGI信仰,就看這個人創(chuàng)業(yè)是在2023年之前還是之后。作為普通用戶,則有另一套判斷標準,即能不能解決實際問題,扎扎實實地提高工作效率。

行事低調的閆俊杰,很少圍繞AGI的話題高談闊論,但在媒體采訪時講述了自己樸素的信仰:Intelligence with everyone。

怎么理解“與用戶共創(chuàng)智能”?海螺AI無疑是最直觀的研究對象。

生產力工具作為當下最擁擠的大模型賽道,市面上的產品已經(jīng)多達幾十款,豆包、文心一言、智譜清言、Kimi……哪怕是在高度內卷的局面下,肩負MiniMax信仰的海螺AI,依然表現(xiàn)出了差異化和稀缺性。

首先是簡潔的產品設計。

為了爭奪用戶的注意力和時長,越來越多的對話式AI產品在首頁上添加了豐富的菜單欄,努力向用戶表達功能的多樣性。海螺AI不可謂不克制,首頁上除了簡單的功能引導和對話框外,并沒有其他影響注意力的元素。

不同的設計風格,似乎談不上孰優(yōu)孰劣,但從生產力工具的定位來說,頁面的簡潔與否和大模型能力不無關系。倘若大模型的能力足夠強大,哪怕沒有花里胡哨的功能露出,也可以通過生成的內容占領用戶心智??桃鈴娬{功能的多樣性和玩法的趣味性,反而在大模型的能力上漏了怯。

其次是過硬的產品能力。

諸如搜索問答、語音對話、長文總結等功能,早已是對話式AI產品的標配,也是高度同質化的主要誘因。但只要深入使用一段時間,或者進行簡單的結果對比,并不難判斷能力上的高下,找到最適合的生產力工具。

而產品能力的強弱,往往體現(xiàn)在一些細節(jié)中。以我們高頻使用的長文總結為例,將第三方行業(yè)報告上傳到海螺AI,可以準確梳理報告的核心信息,并根據(jù)報告內容進行對話。原先閱讀一篇報告需要至少兩個小時的時間,現(xiàn)在不到5分鐘就能完成,工作效率可以說是實現(xiàn)了指數(shù)級增長。

然后是多元的使用場景。

有些產品盡可能在首頁上推薦足夠多的“角色”,來告訴我們有很多使用場景,適合不同的用戶。僅僅在prompt下功夫,當真可以滿足不同人群的需求嗎?市場初期也許奏效,可終歸不是解決問題的最優(yōu)解。

海螺AI的答案是從能力上滿足不同人群的需求:幫研究人員快速總結和分析長篇學術論文或研究報告、幫內容創(chuàng)作者整合關鍵信息并生成爆款文章、幫知識工作者整理和回顧學習資料、為日常用戶提供生活中的即時幫助……就像是一個能打的六邊形戰(zhàn)士,背后是萬億參數(shù)MOE大模型的底氣。

一言以蔽之,只有做出足夠產品化、能服務大眾的AI技術和產品,才可以給社會帶來足夠高的反饋。在MiniMax的認知里,AGI不是原子彈那樣的大殺器,而是普通人每天會用的產品和服務。

04 寫在最后

每一次代際演變的出現(xiàn),都會經(jīng)歷百花齊放到超級APP“統(tǒng)治”市場的過程。

大模型的產品化也不例外。現(xiàn)階段AI產品的核心價值,主要來自模型性能和算法能力,不排除會上演“贏者通吃”的一幕。特別是對于尋求生產力的用戶,擁抱海螺AI這樣的超級APP,卸載掉“嘗鮮”時下載的幾十個APP,將是可以預見的結果。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關文章

  • 庫克已納投名狀:蘋果AI沒得選,只能選百度

    蘋果16弄了兩個版本,一個是專門給中國人用的,準備用百度的AI,還要交錢。第二個是全世界都可以用的,用了ChatGPT,包括臺灣、香港、澳門都可以用。以后都這樣了。好,問題就出在這,蘋果和百度的合作出現(xiàn)問題了,新聞連起來看,才能明白其中含義。新聞一:蘋果正在和騰訊、字節(jié)初步接洽,考慮將二者的AI模型

  • AI加速時代的“進度條”,我們撥動了百分之幾?

    “技術日新月異,人類生活方式正在快速轉變,這一切給人類歷史帶來了一系列不可思議的奇點。我們曾經(jīng)熟悉的一切,都開始變得陌生?!庇嬎銠C之父約翰·馮·諾依曼曾這樣說到。

    標簽:
    ai智能
  • AI視頻賽道,要變天了

    “毀滅你,與你何干?”,這是在劉慈欣的科幻小說《三體》里用來形容人類與三體人之間的戰(zhàn)爭的一句話。

    標簽:
    ai智能
  • “創(chuàng)造市場”與“算法進化”,中美AI競速的岔路口

    “人工智能的商業(yè)模式,是要創(chuàng)造一個市場,而非一個算法”。這是世界AI泰斗MichaelI.Jordan的觀點。而當前的全球AI市場,占據(jù)主導地位的中美雙方,卻也走出了兩條截然不同的技術路徑,前者執(zhí)著于前沿技術的探索,后者則發(fā)力應用優(yōu)化和商業(yè)化落地。南轅北轍的兩個方向,或許已經(jīng)無法直接進行排位先后、優(yōu)

    標簽:
    ai智能
  • 智能體進化發(fā)展了一年,現(xiàn)在的RPA Agent迭代到什么程度了?

    智能體進化發(fā)展了一年,現(xiàn)在的RPAAgent迭代到什么程度了?從實在智能最新發(fā)布的實在Agent7.0,看RPAAgent的迭代升級抓取豆瓣信息、自己制作PPT,這款AIAgent真的實現(xiàn)了流程全自動化AIAgent構建到執(zhí)行全自動化,持續(xù)進化RPAAgent再次降低智能體應用門檻實在智能重磅發(fā)布實

  • 崔大寶:大模型降溫背后的難點、卡點、節(jié)點

    崔大寶|節(jié)點財經(jīng)創(chuàng)始人進入2024年,大模型似乎有熄火之勢:資本市場,與之關聯(lián)的概念炒不動了,英偉達股價動輒暴跌重挫,引發(fā)“泡沫戳破”的擔憂;消費市場,BATH們的推新活動少了,產品更新迭代的速度慢了,民眾的關注度降了……熱鬧的大概只剩下兩場酣仗:自5月15日字節(jié)跳動宣布“以厘計費”,打響國內大模型

    標簽:
    大模型
  • 這一屆“出道”的數(shù)字人,已經(jīng)拿捧上了“鐵飯碗”

    文|智能相對論作者|陳泊丞好消息!你心心念念的事業(yè)單位發(fā)錄取公告了!壞消息!他們沒錄你,錄了個數(shù)字人。圖片來源網(wǎng)絡隨著數(shù)字人技術的突破,越來越多的傳統(tǒng)企業(yè)和機構開始用上了“數(shù)字員工”。甚至很多中國人心心念念的“鐵飯碗”,也被這些數(shù)字人給捧上了。數(shù)字人捧上了“鐵飯碗”簡單翻看一下全國各地事業(yè)單位的“錄

    標簽:
    數(shù)字人
  • 來到IPO關口,地平線離“三分天下”還有多遠?

    黑芝麻智能敲鐘后,港交所門口又有一些智駕芯片企業(yè)引發(fā)關注。據(jù)悉,近日地平線已通過中國證監(jiān)會IPO備案,擬發(fā)行不超過11.5億股境外上市普通股并在香港聯(lián)合交易所上市,預計籌集約5億美元資金。從天眼查可以了解到,該公司成立于2015年,是一家乘用車高級輔助駕駛(ADAS)和高階自動駕駛(AD)解決方案供

  • 機器人大會引領產業(yè)動向,卓翼飛思繪制無人系統(tǒng)教科研新藍圖

    8月21日,萬眾矚目的2024世界機器人大會暨博覽會在北京亦創(chuàng)國際會展中心盛大開幕。這場為期5天,集“展覽”“論壇”“賽事”于一體的機器人盛會,反映了當下機器人領域的繁榮生態(tài)。據(jù)官方統(tǒng)計數(shù)據(jù),今年現(xiàn)場逛展觀眾高達25萬人次,比去年增加25%。機器人行業(yè)有多火?看看2024世界機器人大會火爆程度便可知