1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. 人工智能
  4. 正文

0.6秒!手機跑Stable Diffusion創(chuàng)下最快速度,而這僅僅是開始

 2023-11-16 17:26  來源:互聯(lián)網(wǎng)  我來投稿 撤稿糾錯

  域名預(yù)訂/競價,好“米”不錯過

導(dǎo)語:如今,隨著將大模型塞進手機的進程加快,普通用戶也能親自體驗生成式AI的魅力了。

2023 已經(jīng)行至尾聲,這一年大模型和生成式 AI成為人工智能圈的主流趨勢。自ChatGPT 出現(xiàn)以來,各式各樣通用、專業(yè)的 AI 大模型層出不窮,噴涌之勢已經(jīng)不可阻擋。隨著量化、網(wǎng)絡(luò)剪枝和知識蒸餾等模型壓縮技術(shù)進步,手機等終端設(shè)備AI算力持續(xù)增強,大模型在云端部署之外正在向終端落地邁進。

對于這場已經(jīng)拉開了序幕的「終端側(cè)革命」,芯片巨頭和手機廠商們成為主力軍,他們不斷嘗試在手機等終端設(shè)備上部署運行生成式AI大模型,時不時給人們一點小小的驚喜和震撼。

今年2月,我們第一次看到了在手機上運行超過10 億參數(shù)的文生圖大模型Stable Diffusion。那是在一部搭載高通第二代驍龍 8移動平臺的安卓手機上運行的,不到15秒的時間執(zhí)行20步推理,生成了一張512×512像素的圖像。這也創(chuàng)造了當(dāng)時智能手機上最快的推理速度。

你以為這就是手機運行Stable Diffusion的速度極限了嗎?顯然不是。在上個月舉行的2023驍龍技術(shù)峰會上,不到15秒的生成時間又被整整縮短數(shù)十倍。高通最新旗艦移動平臺第三代驍龍8(以下簡稱驍龍8 Gen 3)讓速度飛升成為可能。

在峰會現(xiàn)場,高通用搭載了驍龍 8 Gen 3的手機運行相同的Stable Diffusion大模型,這次不到1秒(0.6秒)的時間便在本地生成了一張圖像。從15秒到0.6秒,終端側(cè)生成式AI大模型的進化速度讓我們驚嘆不已。

這只是高通在本屆驍龍技術(shù)峰會上展示其終端側(cè)AI能力的牛刀小試。除了生成速度(從 15 秒到 0.6秒)有了質(zhì)的飛躍,驍龍8 Gen 3將支持運行的大模型參數(shù)規(guī)模(從10億到百億)提升一個量級。

大模型賦能平臺也不再局限于手機,高通下一代 AI PC 芯片驍龍X Elite亮相,將百億參數(shù)大模型「塞進」PC平臺,極大拓展了生成式AI應(yīng)用的廣度。

至此,高通在終端側(cè)AI領(lǐng)域積累起來的領(lǐng)導(dǎo)力和技術(shù)領(lǐng)先性進一步得到加強,更賦予了手機、PC,甚至耳機等廠商更多終端AI落地的想象力和可能性。

雙平臺并進,讓生成式AI更加觸手可及

自今年2月以來,高通先后在搭載第二代驍龍8移動平臺的安卓手機上運行Stable Diffusion、ControlNet,讓大模型跑在手機端成為現(xiàn)實。此次驍龍峰會上發(fā)布的驍龍 8 Gen 3 將大模型終端側(cè)落地的潛力提升到了新的高度,使其自身繼續(xù)在該領(lǐng)域引領(lǐng)潮流。

據(jù)了解,驍龍8 Gen 3采用的高通AI引擎擁有面向移動終端的強大Hexagon NPU,集成了升級后的硬件加速單元、微切片推理單元、加強張量、標(biāo)量和矢量單元,所有單元共享 2 倍帶寬的大容量共享內(nèi)存。同時支持 INT8+INT16的混合精度以及 INT4、INT8、INT16和FP16的所有精度。性能較前代提升98%,能效提升40%。

驍龍 8 Gen 3 集成的高通傳感器中樞也更強,擁有2個始終感應(yīng)ISP、2個micro NPU和1個DPS,內(nèi)存增加了30%,支持INT4精度,AI性能提升了3.5倍。

可以說,驍龍 8 Gen 3賦予了手機前所未有的強大終端側(cè)AI性能,成為高通首個專為生成式AI打造的移動平臺。那么這款旗艦級移動平臺是否名副其實呢?這是我們大家最為關(guān)心的問題。

在該平臺上,高通AI引擎首次支持多模態(tài)生成式AI,包括了多種大語言模型、視覺語言模型等。尤其是在終端側(cè),驍龍8 Gen 3 首次支持運行 100億參數(shù)的模型,規(guī)模邁入百億量級。同時將 Stable Diffusion 生成圖像的時間降到了1秒之內(nèi),再次創(chuàng)下最快速度。

在跑Meta大語言模型Llama2-7B時,驍龍8 Gen 3每秒可以生成20個token,同樣是手機終端側(cè)最快之一。

驍龍平臺已經(jīng)支持運行OpenAI、Meta、微軟、安卓、stability.ai、BLOOM、百度、智譜、百川智能、有道等企業(yè)或機構(gòu)的大模型,既為這些廠商將自身大模型能力「下放」到終端側(cè)提供契機,也為用戶體驗生成式AI帶來了豐富的選擇項。

牽一發(fā)而動全身,隨著高通在賦能大模型終端落地上的進一步動作,采用驍龍 8 Gen 3移動平臺的手機廠商快速跟進,加速了大模型集成到手機的進程。

以首發(fā)搭載驍龍 8 Gen 3移動平臺的小米14系列新機為例,AI大模型技術(shù)已經(jīng)集成到小米全新澎湃 OS 中,并上線各種終端側(cè)應(yīng)用。有了大模型能力加持,小米14 支持了 AI 妙畫、AI搜圖、AI寫真、AI擴圖等多項功能,讓輸入法、WPS、相冊煥發(fā)新的活力。

vivo旗下品牌iQOO 12系列同樣搭載了驍龍8 Gen 3移動平臺,全新高通AI引擎使其影像體驗大幅升級,照片質(zhì)感和細節(jié)拉滿。同時該系列手機預(yù)裝的 OriginOS 4系統(tǒng)引入生成式AI功能,AI助手藍心小V可以進行超能語義搜索、超能問答、超能寫作、超能創(chuàng)圖、超能智慧交互,智能化程度明顯提升。此前在驍龍峰會上,榮耀CEO趙明宣布新旗艦手機榮耀Magic 6將搭載驍龍8 Gen 3移動平臺,已支持70億參數(shù)的終端側(cè)AI大模型,為用戶提供更加智能化的體驗。他在現(xiàn)場演示了終端側(cè)AI進行照片搜索、生成視頻等智能操作,效果著實不錯。手機終端融合大模型能力催生了大量或好玩、或有助于提升生產(chǎn)力的生成式 AI應(yīng)用。未來更加豐富的生成式AI應(yīng)用會讓更多用戶切身體驗到 AI的魅力,提升自身交互體驗,這也正是高通致力于在終端側(cè)打造生成式AI能力的重要源動力之一。

在持續(xù)利用AI賦能手機移動平臺之外,高通也在尋求利用并把握好大模型及生成式AI的發(fā)展契機,以此來重塑PC行業(yè),擴大自身在AI領(lǐng)域的領(lǐng)先優(yōu)勢。

生成式AI有了「第二陣地」

高通發(fā)布了面向PC 平臺的全新處理器驍龍X Elite,它采用4nm制程工藝,集成定制的高通Oryon CPU,運行速度是英特爾 12 核處理器的 2倍,功耗比英特爾競品低68%,高峰時段的運行速度比蘋果M2快了50%。

如果這些參數(shù)還無法讓你相信驍龍X Elite的強悍,那就跑個分吧。驍龍 X Elite 擁有兩個版本:注重續(xù)航表現(xiàn)的 23W 版本、主打性能的 80W版本。Geekbench 6測試下的單核和多核得分情況如下圖所示,單核性能尤為亮眼。

同樣地,驍龍X Elite專為AI打造。它采用業(yè)界領(lǐng)先的、集成高通Hexagon NPU的高通AI引擎,異構(gòu)算力高達75TOPS,Hexagon NPU算力為45TOPS,為創(chuàng)意應(yīng)用、視頻會議和生產(chǎn)力助手的變革性體驗提供了算力基礎(chǔ)。高通 AI引擎還支持了大量的加速應(yīng)用程序和體驗,創(chuàng)造無限可能性。

超強生成式 AI 能力也成為驍龍X Elite的一大標(biāo)簽,截止到發(fā)布時,它已支持在端側(cè)運行超過130億參數(shù)的生成式AI模型,面向70億參數(shù)大模型每秒生成30個token,AI處理速度是競品的4.5倍。下圖為PC端AI作畫能力的展示。

從手機到 PC,多樣化的端側(cè)平臺為釋放生成式 AI能力提供了更多渠道。這也表明,高通在終端側(cè)生成式AI落地這條賽道上繼續(xù)「加碼」,背后既離不開技術(shù)上的厚積薄發(fā),也是其在大模型時代自身AI發(fā)展戰(zhàn)略的延續(xù)。

手機、PC加速迎來全新AI時代

在當(dāng)今大模型時代,終端側(cè)部署生成式AI這條路線越來越明晰?;诖?,高通秉持「混合AI是AI的未來」這一理念和戰(zhàn)略,注重云端與終端的協(xié)同發(fā)展,并認為終端側(cè)AI是擴展生成式AI至全球更廣泛范圍的關(guān)鍵。

遵循這一前瞻性認知,高通一步步積累,逐漸在自身布局中構(gòu)建了強大、全面的終端側(cè)AI能力,并引領(lǐng)了端側(cè)大模型及生成式AI的革新與進步。毫無疑問,此次驍龍峰會上發(fā)布的驍龍 8 Gen 3、驍龍X Elite將進一步夯實高通作為終端側(cè)AI領(lǐng)導(dǎo)者的地位。

如果大模型繼續(xù)保持當(dāng)前的落地步伐,我們將可以在手機、PC 甚至XR可穿戴設(shè)備、智能網(wǎng)聯(lián)汽車等智能終端上體驗到更多生成式AI應(yīng)用,讓人機交互更加自然且個性化。反過來,這些生成式AI應(yīng)用以及帶來的體驗變革也將對這些終端設(shè)備產(chǎn)生深遠影響,甚至改變它們的核心驅(qū)動力,重新定義它們。

我們以與人們?nèi)粘9ぷ?、生活息息相關(guān)的手機為例,在追求絕對性能之外,人們越來越多地關(guān)注一些創(chuàng)意性應(yīng)用。這就需要AI大顯身手,生成式AI性能更是成為下一代手機處理器角逐的核心競爭力。

驍龍移動平臺近年來持續(xù)發(fā)力于此也在意料之中了。從去年的驍龍8 Gen 2 到此次驍龍峰會上的驍龍 8 Gen 3,AI 早已無處不在,生成式 AI 一躍成為「AI 皇冠上的新明珠」,受到了廣泛關(guān)注和青睞。

隨著大模型及生成式AI在手機終端落地的范圍越來越廣、成熟度越來越高,我們或許可以看到:傳統(tǒng)智能手機被生成式 AI 能力全方位加持的「AI 手機」所取代。小米等手機廠商新發(fā)布的旗艦機在這方面已經(jīng)初具雛形,利用生成式AI增強一些場景的使用體驗和效率,為未來顛覆手機的質(zhì)變做好了充分的量變。

同時,PC 終端的革新也有類似向生成式 AI 能力傾斜的發(fā)展趨勢。在這方面,集成到Windows 中的微軟 Copilot是一個很好的例證。當(dāng)然還有更多生成式AI變革人類與 PC 交互的場景和方式,借此實現(xiàn)更高效的智能協(xié)作、更簡化的工作流程、更強大的生產(chǎn)力、更定制化的使用體驗。

驍龍 X Elite 一出手便瞄準(zhǔn)生成式 AI,勢必會為當(dāng)前的PC市場注入新鮮血液。在第六屆虹橋國際經(jīng)濟論壇 ——「智能科技與未來產(chǎn)業(yè)發(fā)展」分論壇上,高通公司中國區(qū)董事長孟樸發(fā)表了主題演講,認為下一代 PC 將進入一個全新的「AI PC」時代,以智能、高性能、高效等為特點, 并將對辦公效率等方面產(chǎn)生重要意義。

相信未來高通會在驍龍 8 Gen 3 等移動平臺和驍龍 X Elite等PC平臺的基礎(chǔ)上,繼續(xù)加強自身在大模型和生成式AI上的基礎(chǔ)能力。加之更多搭載這些平臺的廠商發(fā)布全新旗艦手機和 PC 產(chǎn)品,他們不斷增強的自主性及自研能力可以讓我們期待更多樣化生成式AI應(yīng)用的亮相。

不過,在「AI 手機」和「AI PC 時代」真正到來之前,還要看生成式AI能力是否能讓用戶產(chǎn)生強烈感知、是否能準(zhǔn)確滿足他們的需求、是否能對相關(guān)應(yīng)用產(chǎn)生依賴性、以及是否能帶動他們換機的欲望,這些都是高通和手機廠商現(xiàn)在及未來要考慮的問題。

結(jié)語

自發(fā)布以來,驍龍 8 Gen 3、驍龍X Elite展現(xiàn)出的強大生成式AI能力留給人們無限的想象空間。 正如高通公司總裁兼 CEO 安蒙所言,「我們正在進入將改變用戶體驗的生成式AI時代,也將創(chuàng)造一個移動行業(yè)和計算行業(yè)的全新周期?!?/p>

在這一進程中,作為終端側(cè)領(lǐng)導(dǎo)者的高通正擔(dān)負起應(yīng)有的時代角色。一方面,利用自身強大的全棧AI優(yōu)化能力匯聚軟硬件各方,助力終端側(cè)AI生態(tài)快速發(fā)展;另一方面,全新的跨平臺技術(shù)「Snapdragon Seamless」實現(xiàn)安卓、Windows 和其他操作系統(tǒng)無縫銜接,這種多終端體驗有望將 AI在手機、PC 等終端上的落地進一步拓展開來。

可以預(yù)見,基于驍龍生態(tài)的AI體驗會非??焖黉佌归_來,各種應(yīng)用落地的速度也將大大加快。未來,高通將繼續(xù)保持自身在終端側(cè)AI的技術(shù)優(yōu)勢,推動大模型在部署應(yīng)用時更便捷、更豐富、更有吸引力。同時,攜手各大廠商創(chuàng)新基于大模型的生成式AI應(yīng)用,降低普通用戶使用生成式AI的門檻。

隨著新的生成式AI時代開啟,高通是否能持續(xù)滿足人們的期待,我想這次驍龍峰會已經(jīng)給了我們答案。

(文章轉(zhuǎn)載自機器之心公眾號)

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關(guān)標(biāo)簽
ai技術(shù)

相關(guān)文章

  • 四名在讀研究生,用昇騰AI探索軟件定義的未來制造

    過去幾年中,“柔性化”這個詞經(jīng)常被各大主機廠商掛在嘴邊。簡單地說就是千人千面的柔性生產(chǎn),越來越多的工廠開始實行訂單制生產(chǎn)模式,每一臺車都能根據(jù)客戶的需求個性化定制,同一條產(chǎn)線可以實現(xiàn)SUV、MPV、轎車等不同車型的混合生產(chǎn)。只是在柔性生產(chǎn)的大背景下,制造環(huán)節(jié)還有一些待解的老問題。比如汽車焊接工藝中普

    標(biāo)簽:
    ai技術(shù)
  • 積云教育新課程一箭雙雕,掀起“AI+短視頻”學(xué)習(xí)新風(fēng)潮

    2023年以來,由AI掀起的風(fēng)潮,可謂“亂花漸欲迷人眼”:OpenAI、ChatGPT、Midjourney、文心一言、通義千問、盤古大模型......緊跟著AIGC火爆全網(wǎng),其在短視頻內(nèi)容創(chuàng)作領(lǐng)域中蘊育著巨大的應(yīng)用前景:據(jù)第52次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》數(shù)據(jù)顯示,截至2023年6月,我國短

    標(biāo)簽:
    ai技術(shù)
  • 投資AIGC概念要關(guān)注什么,弄懂這幾點就不會盲目

    數(shù)字經(jīng)濟時代,人工智能相關(guān)產(chǎn)業(yè)迎來廣闊發(fā)展,AIGC概念股隨之火爆A股市場。和人工智能相關(guān)的技術(shù)、芯片、應(yīng)用等消息不絕于耳,AI企業(yè)云天勵飛最新一代DeepEdge10芯片自今年投入使用來就備受矚目,隨著公司第三季度報告的出爐,云天勵飛第三季度主營收入8062.33萬元,同比上升13.52%,儼然是

    標(biāo)簽:
    ai技術(shù)
  • 與生成式AI并肩作戰(zhàn),愛采購為B2B行業(yè)揭示未來……

    2023年,是人工智能技術(shù)的爆發(fā)之年。ChatGPT、百度文心一言等生成式AI接連涌現(xiàn),讓我們親歷科技領(lǐng)域的輪番變革。我們看到,傳統(tǒng)的企業(yè)經(jīng)營模式正在被改寫、被重構(gòu),B2B采購領(lǐng)域面臨嚴(yán)峻的提效挑戰(zhàn)。如何利用前沿數(shù)字技術(shù)變革B2B行業(yè)?如何讓人工智能融入數(shù)字營銷、造福更多中小企業(yè)?諸多難題橫亙在我們

    標(biāo)簽:
    ai技術(shù)
  • 全面進入AI大模型時代,360智慧生活推動安防領(lǐng)域跨越式升級

    在大模型的引入下,安防領(lǐng)域迎來了突破契機。

    標(biāo)簽:
    ai技術(shù)
  • 庫克已納投名狀:蘋果AI沒得選,只能選百度

    蘋果16弄了兩個版本,一個是專門給中國人用的,準(zhǔn)備用百度的AI,還要交錢。第二個是全世界都可以用的,用了ChatGPT,包括臺灣、香港、澳門都可以用。以后都這樣了。好,問題就出在這,蘋果和百度的合作出現(xiàn)問題了,新聞連起來看,才能明白其中含義。新聞一:蘋果正在和騰訊、字節(jié)初步接洽,考慮將二者的AI模型

    標(biāo)簽:
    蘋果AI
    百度AI
    庫克
  • AI加速時代的“進度條”,我們撥動了百分之幾?

    “技術(shù)日新月異,人類生活方式正在快速轉(zhuǎn)變,這一切給人類歷史帶來了一系列不可思議的奇點。我們曾經(jīng)熟悉的一切,都開始變得陌生?!庇嬎銠C之父約翰·馮·諾依曼曾這樣說到。

    標(biāo)簽:
    ai智能
  • AI視頻賽道,要變天了

    “毀滅你,與你何干?”,這是在劉慈欣的科幻小說《三體》里用來形容人類與三體人之間的戰(zhàn)爭的一句話。

    標(biāo)簽:
    ai智能
  • “創(chuàng)造市場”與“算法進化”,中美AI競速的岔路口

    “人工智能的商業(yè)模式,是要創(chuàng)造一個市場,而非一個算法”。這是世界AI泰斗MichaelI.Jordan的觀點。而當(dāng)前的全球AI市場,占據(jù)主導(dǎo)地位的中美雙方,卻也走出了兩條截然不同的技術(shù)路徑,前者執(zhí)著于前沿技術(shù)的探索,后者則發(fā)力應(yīng)用優(yōu)化和商業(yè)化落地。南轅北轍的兩個方向,或許已經(jīng)無法直接進行排位先后、優(yōu)

    標(biāo)簽:
    ai智能
  • 智能體進化發(fā)展了一年,現(xiàn)在的RPA Agent迭代到什么程度了?

    智能體進化發(fā)展了一年,現(xiàn)在的RPAAgent迭代到什么程度了?從實在智能最新發(fā)布的實在Agent7.0,看RPAAgent的迭代升級抓取豆瓣信息、自己制作PPT,這款A(yù)IAgent真的實現(xiàn)了流程全自動化AIAgent構(gòu)建到執(zhí)行全自動化,持續(xù)進化RPAAgent再次降低智能體應(yīng)用門檻實在智能重磅發(fā)布實

  • 崔大寶:大模型降溫背后的難點、卡點、節(jié)點

    崔大寶|節(jié)點財經(jīng)創(chuàng)始人進入2024年,大模型似乎有熄火之勢:資本市場,與之關(guān)聯(lián)的概念炒不動了,英偉達股價動輒暴跌重挫,引發(fā)“泡沫戳破”的擔(dān)憂;消費市場,BATH們的推新活動少了,產(chǎn)品更新迭代的速度慢了,民眾的關(guān)注度降了……熱鬧的大概只剩下兩場酣仗:自5月15日字節(jié)跳動宣布“以厘計費”,打響國內(nèi)大模型

    標(biāo)簽:
    大模型
  • 這一屆“出道”的數(shù)字人,已經(jīng)拿捧上了“鐵飯碗”

    文|智能相對論作者|陳泊丞好消息!你心心念念的事業(yè)單位發(fā)錄取公告了!壞消息!他們沒錄你,錄了個數(shù)字人。圖片來源網(wǎng)絡(luò)隨著數(shù)字人技術(shù)的突破,越來越多的傳統(tǒng)企業(yè)和機構(gòu)開始用上了“數(shù)字員工”。甚至很多中國人心心念念的“鐵飯碗”,也被這些數(shù)字人給捧上了。數(shù)字人捧上了“鐵飯碗”簡單翻看一下全國各地事業(yè)單位的“錄

    標(biāo)簽:
    數(shù)字人
  • 來到IPO關(guān)口,地平線離“三分天下”還有多遠?

    黑芝麻智能敲鐘后,港交所門口又有一些智駕芯片企業(yè)引發(fā)關(guān)注。據(jù)悉,近日地平線已通過中國證監(jiān)會IPO備案,擬發(fā)行不超過11.5億股境外上市普通股并在香港聯(lián)合交易所上市,預(yù)計籌集約5億美元資金。從天眼查可以了解到,該公司成立于2015年,是一家乘用車高級輔助駕駛(ADAS)和高階自動駕駛(AD)解決方案供

  • 機器人大會引領(lǐng)產(chǎn)業(yè)動向,卓翼飛思繪制無人系統(tǒng)教科研新藍圖

    8月21日,萬眾矚目的2024世界機器人大會暨博覽會在北京亦創(chuàng)國際會展中心盛大開幕。這場為期5天,集“展覽”“論壇”“賽事”于一體的機器人盛會,反映了當(dāng)下機器人領(lǐng)域的繁榮生態(tài)。據(jù)官方統(tǒng)計數(shù)據(jù),今年現(xiàn)場逛展觀眾高達25萬人次,比去年增加25%。機器人行業(yè)有多火?看看2024世界機器人大會火爆程度便可知