亚洲精品无码乱码成人|最近中文字幕免费大全|日韩欧美卡一卡二卡新区|熟妇性饥渴一区二区三区|久久久久无码精品国产AV|欧美日韩国产va在线观看|久久精品一本到99热动态图|99国产精品欧美一区二区三区

您現(xiàn)在的位置是: 財經(jīng) > > 正文

大模型“瘦身”進(jìn)手機(jī) 下一個iPhone時刻將至?

時間:2023-08-09 20:48:53 來源:元宇宙日爆 發(fā)布者:DN032

一股“端側(cè)大模型”浪潮正在涌來。華為、高通等芯片巨頭正探索將AI大模型植入端側(cè),讓手機(jī)實現(xiàn)新一代物種進(jìn)化。


(資料圖片)

相比ChatGPT、Midjourney等AI應(yīng)用依賴云端服務(wù)器提供服務(wù),端側(cè)大模型主打在本地實現(xiàn)智能化。它的優(yōu)勢在于能夠更好地保護(hù)隱私,同時讓手機(jī)能通過學(xué)習(xí)成為用戶的私人智能助手,還不必?fù)?dān)心云端服務(wù)器宕機(jī)等問題。

不過,現(xiàn)有技術(shù)條件下,手機(jī)性能遠(yuǎn)不足以支撐大模型運行。業(yè)內(nèi)主流的技術(shù)方案是,通過剪枝、量化、蒸餾來給大模型“瘦身”,在盡可能少地減損精度的前提下,降低它所需的資源和能耗。

高通已經(jīng)開始研發(fā)用于端側(cè)大模型的芯片。這預(yù)示著,部署AI模型的手機(jī)終端正在向我們走來。

手機(jī)廠商將大模型引向移動端

AI大模型正在從云端向智能終端狂奔。

8月4日,在2023年華為開發(fā)者大會上,華為對外發(fā)布HarmonyOS 4,相比前幾代操作系統(tǒng),它最顯著的一大變化是,將AI大模型能力內(nèi)置在了系統(tǒng)底層。華為正在拉開AI模型走向“智能終端側(cè)”的序幕。

目前,人們使用ChatGPT、Midjourney等AI應(yīng)用提供的服務(wù),基本都是通過云端服務(wù)器來完成。以ChatGPT為例,它背后的大模型和計算資源都存儲在遠(yuǎn)程服務(wù)器上,用戶通過與服務(wù)器實時交互,被輸入的文本經(jīng)服務(wù)器處理后,獲得返回響應(yīng)。這樣的好處在于,可以確保模型的高效穩(wěn)定運行,因為服務(wù)器通常配置了強大的計算資源,而且可以隨時擴(kuò)展以適應(yīng)高負(fù)載。

如今,新的支持邏輯出現(xiàn)了。華為正在嘗試將大模型引入終端,這意味著上述所有工作都能在本地完成,手機(jī)系統(tǒng)本身就具備了一定的AI能力,不需要接入AI云端服務(wù),也能實現(xiàn)智能化升級。

華為常務(wù)董事、終端BG CEO余承東介紹,HarmonyOS 4由華為盤古大模型提供底層支持,希望給用戶帶來智慧終端交互、高階生產(chǎn)力效率、個性化服務(wù)的全新AI體驗變革。

HarmonyOS 4引入了AI大模型

HarmonyOS 4的AI能力目前主要由華為智慧助手“小藝”體現(xiàn)。大模型接入后,小藝在語音交互的基礎(chǔ)上,擴(kuò)展了文字、圖片和文檔等多種形式的輸入,自然語言理解能力得到提升。小藝還能根據(jù)指令,連接多種服務(wù)和場景,比如自動提取圖片文字,生成各類商業(yè)電子郵件內(nèi)容或生成圖像等。

更重要的改變是,小藝具備了記憶和學(xué)習(xí)能力,隨著不斷使用,它將變得越來越懂“主人”,能夠智能給出出行、活動計劃等方案,并根據(jù)根據(jù)用戶習(xí)慣,實現(xiàn)個性化推薦。華為透露,小藝這些新的能力,將在8月下旬開啟公開測試體驗。

將AI大模型內(nèi)置于手機(jī)系統(tǒng)底層,華為希望借此全盤提升手機(jī)的智能化程度。雖然小藝的上述功能并不“高深”,但要實現(xiàn)起來,用戶往往需要同時調(diào)用ChatGPT、Midjourney等眾多應(yīng)用才能完成。當(dāng)手機(jī)本身有了AI能力后,它就像一個更全能的助手,提供全面的服務(wù)。

在HarmonyOS 4發(fā)布之前,華為其實已經(jīng)嘗試過將AI大模型接入移動終端。今年3月,華為發(fā)布P60手機(jī),其中自帶的智慧搜圖功能就是基于多模態(tài)大模型技術(shù),通過在手機(jī)側(cè)對模型做小型化處理,實現(xiàn)了手機(jī)端的自然語言模型運行。

將AI模型引入端側(cè),華為并不是頭一家。在2023世界人工智能大會上,高通展示了大模型進(jìn)入端側(cè)的操作實踐,將生成式AI模型Stable Diffusion放在搭載了第二代驍龍8的手機(jī)上運行,15秒內(nèi)執(zhí)行了20步推理,并生成了一張512x512像素的圖像,且圖像效果與云端處理水平相差并不明顯。

在上海MWC 2023期間,榮耀CEO趙明也表示,榮耀將在智能手機(jī)端推動部署端側(cè)大模型,以此實現(xiàn)多模態(tài)自然交互、精準(zhǔn)意圖識別、復(fù)雜任務(wù)的閉環(huán)服務(wù)等體驗。

備受矚目的還有蘋果,一個月前,蘋果被曝出正在秘密研發(fā)“Apple GPT”,它是一款基于蘋果自研的Ajax框架開發(fā)的人工智能工具。盡管具體的細(xì)節(jié)尚有待披露,但業(yè)內(nèi)普遍猜測,蘋果很可能在系統(tǒng)層加入大模型,提升提升語音助手Siri的智力,讓Siri摘掉“人工智障”的帽子。

炒作還是新革命?

手機(jī)廠商盯上大模型不稀奇,但為啥他們要走“端側(cè)”路線?畢竟,華為小藝的交互、生成能力通過云端服務(wù)器也能提供,而且看起來成本更經(jīng)濟(jì)、技術(shù)實現(xiàn)更容易。

把AI大模型裝進(jìn)智能移動端,是炒作還是確實有其必要性?在這一問題上,無論是余承東還是趙明,都提到了兩個關(guān)鍵詞:隱私安全和個性化。

余承東強調(diào),華為主張所有AI體驗創(chuàng)新和場景設(shè)計的第一原則是安全與隱私保護(hù),打造更負(fù)責(zé)任的AI,并承諾AI生成的內(nèi)容都會進(jìn)行標(biāo)識。

相比在云端處理數(shù)據(jù),智能終端側(cè)最明顯的優(yōu)勢在于隱私安全。此前,ChatGPT屢次陷入數(shù)據(jù)泄露風(fēng)波。今年3月,三星在內(nèi)部發(fā)布了ChatGPT使用禁令,起因是半導(dǎo)體員工疑似因使用ChatGPT泄露了公司機(jī)密;上個月,ChatGPT背后公司OpenAI及其股東微軟被16人匿名起訴,控訴他們在未經(jīng)允許的情況下使用并泄露了個人隱私數(shù)據(jù),索賠金額高達(dá)30億美元。

當(dāng)數(shù)據(jù)處理都在端側(cè),用戶的個人數(shù)據(jù)將不會上傳至云端服務(wù)器,大幅降低了隱私泄露風(fēng)險。這也為手機(jī)AI助手真正變成生活管家提供了先決條件——只有隱私得到保障,用戶才會放心將數(shù)據(jù)交給AI去學(xué)習(xí)。

在趙明的理解中,端側(cè)AI大模型的使命就是更好地理解用戶,“知道我?guī)c睡覺,知道我喜歡吃什么,能解決我的即時需求,相當(dāng)于擁有洞察我需求的能力?!倍龅竭@些,就需要AI基于用戶的個人數(shù)據(jù)和習(xí)慣進(jìn)行訓(xùn)練,最終智能手機(jī)將有希望成為全能助手,或者說是私人機(jī)器人秘書,能夠幫助用戶解決餐飲、訂票、咨詢、娛樂、辦公等多場景的需求。

相比之下,無論是ChatGPT還是其他主流的AI應(yīng)用,都是標(biāo)準(zhǔn)化產(chǎn)品,在不加改造的情況下很難具備私人助手的能力,它并不了解用戶,只是根據(jù)用戶的輸入指令做出相應(yīng)的回應(yīng)。個人手機(jī)已經(jīng)是一個私有的個人智能設(shè)備,如果理解人類語言的AI模型能跑在手機(jī)上,智能化程度無疑將得到大提升。

另外,依賴云端的應(yīng)用也存在不穩(wěn)定性,比如由于網(wǎng)絡(luò)或服務(wù)器原因,云端的響應(yīng)速度可能會變慢,甚至干脆宕機(jī),這在ChatGPT上已經(jīng)出現(xiàn)多次,本地化的大模型將大大削弱對云端的依賴,從而避免“云卡頓”。

基于上述特點,大模型的“端側(cè)革命”展現(xiàn)出了潛力,甚至有希望讓進(jìn)入發(fā)展瓶頸多年的手機(jī)再來一次激動人心的物種進(jìn)化,就像當(dāng)年大屏智能手機(jī)的出現(xiàn)以及iPhone發(fā)布時刻一樣。

但大模型想在手機(jī)端發(fā)揮實力存在一個顯而易見的問題:手機(jī)芯片頂?shù)米??由于大模型動輒包含上百億、千億的參數(shù),且需要天文級的訓(xùn)練,消耗龐大的算力,現(xiàn)有手機(jī)芯片的性能顯然無法滿足要求。

對此,業(yè)內(nèi)目前較主流的解決方案是“模型小型化”。

簡單來說,當(dāng)模型網(wǎng)絡(luò)結(jié)構(gòu)確定后,在盡可能少地降低精度的前提下,給模型“瘦身”,從而降低它所需的資源和能耗。這一過程通常有三步,將模型中對精度影響非常小的參數(shù)裁剪掉,被稱為“剪枝”;使用更低精度的數(shù)據(jù)類型進(jìn)行推理,行話叫“量化”;而從復(fù)雜的模型中,提取出效果相近但更加簡單的模型,被形象地稱作“蒸餾”。最終目的,都是為了減小模型體積。

另一方面,高通等芯片廠商,也在針對AI大模型端側(cè)部署研發(fā)專用的芯片。此前,高通5G移動平臺驍龍8 Gen2首度集成的AI專用Hexagon處理器,采用了獨立的專用供電系統(tǒng),支持微切片推理、INT4精度和Transformer網(wǎng)絡(luò)加速等,能在提供更高性能的同時,降低能耗和內(nèi)存占用。

端側(cè)大模型正在掀起新一代智能終端革命。IDC預(yù)測,到2026年,中國市場中近50%的終端設(shè)備的處理器將帶有AI引擎技術(shù)。AI帶給人類科技生活的又一個巨變或?qū)⒊霈F(xiàn)。

標(biāo)簽:

搶先讀

相關(guān)文章

熱文推薦

精彩放送

關(guān)于我們| 聯(lián)系我們| 投稿合作| 法律聲明| 廣告投放

版權(quán)所有© 2011-2023  產(chǎn)業(yè)研究網(wǎng)  m.www-332159.com

所載文章、數(shù)據(jù)僅供參考.本站不作任何非法律允許范圍內(nèi)服務(wù)!

聯(lián)系我們:39 60 29 14 2 @qq.com

皖I(lǐng)CP備2022009963號-13