您現(xiàn)在的位置是：財經(jīng) > > 正文

大模型“瘦身”進手機下一個iPhone時刻將至？

時間：2023-08-09 20:48:53 來源：元宇宙日爆發(fā)布者：DN032

一股“端側(cè)大模型”浪潮正在涌來。華為、高通等芯片巨頭正探索將AI大模型植入端側(cè)，讓手機實現(xiàn)新一代物種進化。

(資料圖片)

相比ChatGPT、Midjourney等AI應用依賴云端服務器提供服務，端側(cè)大模型主打在本地實現(xiàn)智能化。它的優(yōu)勢在于能夠更好地保護隱私，同時讓手機能通過學習成為用戶的私人智能助手，還不必擔心云端服務器宕機等問題。

不過，現(xiàn)有技術條件下，手機性能遠不足以支撐大模型運行。業(yè)內(nèi)主流的技術方案是，通過剪枝、量化、蒸餾來給大模型“瘦身”，在盡可能少地減損精度的前提下，降低它所需的資源和能耗。

高通已經(jīng)開始研發(fā)用于端側(cè)大模型的芯片。這預示著，部署AI模型的手機終端正在向我們走來。

手機廠商將大模型引向移動端
AI大模型正在從云端向智能終端狂奔。
8月4日，在2023年華為開發(fā)者大會上，華為對外發(fā)布HarmonyOS 4，相比前幾代操作系統(tǒng)，它最顯著的一大變化是，將AI大模型能力內(nèi)置在了系統(tǒng)底層。華為正在拉開AI模型走向“智能終端側(cè)”的序幕。
目前，人們使用ChatGPT、Midjourney等AI應用提供的服務，基本都是通過云端服務器來完成。以ChatGPT為例，它背后的大模型和計算資源都存儲在遠程服務器上，用戶通過與服務器實時交互，被輸入的文本經(jīng)服務器處理后，獲得返回響應。這樣的好處在于，可以確保模型的高效穩(wěn)定運行，因為服務器通常配置了強大的計算資源，而且可以隨時擴展以適應高負載。
如今，新的支持邏輯出現(xiàn)了。華為正在嘗試將大模型引入終端，這意味著上述所有工作都能在本地完成，手機系統(tǒng)本身就具備了一定的AI能力，不需要接入AI云端服務，也能實現(xiàn)智能化升級。
華為常務董事、終端BG CEO余承東介紹，HarmonyOS 4由華為盤古大模型提供底層支持，希望給用戶帶來智慧終端交互、高階生產(chǎn)力效率、個性化服務的全新AI體驗變革。
HarmonyOS 4引入了AI大模型
HarmonyOS 4的AI能力目前主要由華為智慧助手“小藝”體現(xiàn)。大模型接入后，小藝在語音交互的基礎上，擴展了文字、圖片和文檔等多種形式的輸入，自然語言理解能力得到提升。小藝還能根據(jù)指令，連接多種服務和場景，比如自動提取圖片文字，生成各類商業(yè)電子郵件內(nèi)容或生成圖像等。
更重要的改變是，小藝具備了記憶和學習能力，隨著不斷使用，它將變得越來越懂“主人”，能夠智能給出出行、活動計劃等方案，并根據(jù)根據(jù)用戶習慣，實現(xiàn)個性化推薦。華為透露，小藝這些新的能力，將在8月下旬開啟公開測試體驗。
將AI大模型內(nèi)置于手機系統(tǒng)底層，華為希望借此全盤提升手機的智能化程度。雖然小藝的上述功能并不“高深”，但要實現(xiàn)起來，用戶往往需要同時調(diào)用ChatGPT、Midjourney等眾多應用才能完成。當手機本身有了AI能力后，它就像一個更全能的助手，提供全面的服務。
在HarmonyOS 4發(fā)布之前，華為其實已經(jīng)嘗試過將AI大模型接入移動終端。今年3月，華為發(fā)布P60手機，其中自帶的智慧搜圖功能就是基于多模態(tài)大模型技術，通過在手機側(cè)對模型做小型化處理，實現(xiàn)了手機端的自然語言模型運行。
將AI模型引入端側(cè)，華為并不是頭一家。在2023世界人工智能大會上，高通展示了大模型進入端側(cè)的操作實踐，將生成式AI模型Stable Diffusion放在搭載了第二代驍龍8的手機上運行，15秒內(nèi)執(zhí)行了20步推理，并生成了一張512x512像素的圖像，且圖像效果與云端處理水平相差并不明顯。
在上海MWC 2023期間，榮耀CEO趙明也表示，榮耀將在智能手機端推動部署端側(cè)大模型，以此實現(xiàn)多模態(tài)自然交互、精準意圖識別、復雜任務的閉環(huán)服務等體驗。
備受矚目的還有蘋果，一個月前，蘋果被曝出正在秘密研發(fā)“Apple GPT”，它是一款基于蘋果自研的Ajax框架開發(fā)的人工智能工具。盡管具體的細節(jié)尚有待披露，但業(yè)內(nèi)普遍猜測，蘋果很可能在系統(tǒng)層加入大模型，提升提升語音助手Siri的智力，讓Siri摘掉“人工智障”的帽子。
炒作還是新革命？
手機廠商盯上大模型不稀奇，但為啥他們要走“端側(cè)”路線？畢竟，華為小藝的交互、生成能力通過云端服務器也能提供，而且看起來成本更經(jīng)濟、技術實現(xiàn)更容易。
把AI大模型裝進智能移動端，是炒作還是確實有其必要性？在這一問題上，無論是余承東還是趙明，都提到了兩個關鍵詞：隱私安全和個性化。
余承東強調(diào)，華為主張所有AI體驗創(chuàng)新和場景設計的第一原則是安全與隱私保護，打造更負責任的AI，并承諾AI生成的內(nèi)容都會進行標識。
相比在云端處理數(shù)據(jù)，智能終端側(cè)最明顯的優(yōu)勢在于隱私安全。此前，ChatGPT屢次陷入數(shù)據(jù)泄露風波。今年3月，三星在內(nèi)部發(fā)布了ChatGPT使用禁令，起因是半導體員工疑似因使用ChatGPT泄露了公司機密；上個月，ChatGPT背后公司OpenAI及其股東微軟被16人匿名起訴，控訴他們在未經(jīng)允許的情況下使用并泄露了個人隱私數(shù)據(jù)，索賠金額高達30億美元。
當數(shù)據(jù)處理都在端側(cè)，用戶的個人數(shù)據(jù)將不會上傳至云端服務器，大幅降低了隱私泄露風險。這也為手機AI助手真正變成生活管家提供了先決條件——只有隱私得到保障，用戶才會放心將數(shù)據(jù)交給AI去學習。
在趙明的理解中，端側(cè)AI大模型的使命就是更好地理解用戶，“知道我?guī)c睡覺，知道我喜歡吃什么，能解決我的即時需求，相當于擁有洞察我需求的能力?！倍龅竭@些，就需要AI基于用戶的個人數(shù)據(jù)和習慣進行訓練，最終智能手機將有希望成為全能助手，或者說是私人機器人秘書，能夠幫助用戶解決餐飲、訂票、咨詢、娛樂、辦公等多場景的需求。
相比之下，無論是ChatGPT還是其他主流的AI應用，都是標準化產(chǎn)品，在不加改造的情況下很難具備私人助手的能力，它并不了解用戶，只是根據(jù)用戶的輸入指令做出相應的回應。個人手機已經(jīng)是一個私有的個人智能設備，如果理解人類語言的AI模型能跑在手機上，智能化程度無疑將得到大提升。
另外，依賴云端的應用也存在不穩(wěn)定性，比如由于網(wǎng)絡或服務器原因，云端的響應速度可能會變慢，甚至干脆宕機，這在ChatGPT上已經(jīng)出現(xiàn)多次，本地化的大模型將大大削弱對云端的依賴，從而避免“云卡頓”。
基于上述特點，大模型的“端側(cè)革命”展現(xiàn)出了潛力，甚至有希望讓進入發(fā)展瓶頸多年的手機再來一次激動人心的物種進化，就像當年大屏智能手機的出現(xiàn)以及iPhone發(fā)布時刻一樣。
但大模型想在手機端發(fā)揮實力存在一個顯而易見的問題：手機芯片頂?shù)米幔坑捎诖竽Ｐ蛣虞m包含上百億、千億的參數(shù)，且需要天文級的訓練，消耗龐大的算力，現(xiàn)有手機芯片的性能顯然無法滿足要求。
對此，業(yè)內(nèi)目前較主流的解決方案是“模型小型化”。
簡單來說，當模型網(wǎng)絡結構確定后，在盡可能少地降低精度的前提下，給模型“瘦身”，從而降低它所需的資源和能耗。這一過程通常有三步，將模型中對精度影響非常小的參數(shù)裁剪掉，被稱為“剪枝”；使用更低精度的數(shù)據(jù)類型進行推理，行話叫“量化”；而從復雜的模型中，提取出效果相近但更加簡單的模型，被形象地稱作“蒸餾”。最終目的，都是為了減小模型體積。
另一方面，高通等芯片廠商，也在針對AI大模型端側(cè)部署研發(fā)專用的芯片。此前，高通5G移動平臺驍龍8 Gen2首度集成的AI專用Hexagon處理器，采用了獨立的專用供電系統(tǒng)，支持微切片推理、INT4精度和Transformer網(wǎng)絡加速等，能在提供更高性能的同時，降低能耗和內(nèi)存占用。
端側(cè)大模型正在掀起新一代智能終端革命。IDC預測，到2026年，中國市場中近50%的終端設備的處理器將帶有AI引擎技術。AI帶給人類科技生活的又一個巨變或?qū)⒊霈F(xiàn)。

標簽：

亚洲精品无码乱码成人|最近中文字幕免费大全|日韩欧美卡一卡二卡新区|熟妇性饥渴一区二区三区|久久久久无码精品国产AV|欧美日韩国产va在线观看|久久精品一本到99热动态图|99国产精品欧美一区二区三区

首頁

資訊

熱點

專題

地產(chǎn)

創(chuàng)投

教育

財經(jīng)

汽車

股票

產(chǎn)經(jīng)

金融

大模型“瘦身”進手機下一個iPhone時刻將至？

搶先讀

相關文章

熱文推薦

精彩放送

大模型“瘦身”進手機 下一個iPhone時刻將至？

搶先讀

相關文章

熱文推薦

精彩放送

大模型“瘦身”進手機下一個iPhone時刻將至？