亚洲精品无码乱码成人|最近中文字幕免费大全|日韩欧美卡一卡二卡新区|熟妇性饥渴一区二区三区|久久久久无码精品国产AV|欧美日韩国产va在线观看|久久精品一本到99热动态图|99国产精品欧美一区二区三区

您現(xiàn)在的位置是: 熱點(diǎn) > > 正文

當(dāng)前熱點(diǎn)輕量化小模型興起,中小企業(yè)也能搭上AI“快車”

時(shí)間:2025-07-10 10:45:08 來(lái)源:工人日?qǐng)?bào) 發(fā)布者:DN032
隨著人工智能快速發(fā)展迭代,一些企業(yè)開始押注小模型。相較大模型,低成本、上線快、易調(diào)試的小模型,以更高的性價(jià)比為中小企業(yè)和個(gè)人用戶提供了打開人工智能大門的鑰匙。

近兩年,人工智能快速發(fā)展迭代,大語(yǔ)言模型如雨后春筍般涌現(xiàn),文本生成、文生圖、語(yǔ)音處理、代碼處理、視頻處理等生成式人工智能走進(jìn)人們的生活。同時(shí),一些企業(yè)開始發(fā)力研發(fā)可在電腦、手機(jī)端訓(xùn)練的輕量化小模型。

“我們需要高鐵、飛機(jī)、游輪等大型交通工具,也需要私家轎車、公交車,以及摩托車、自行車等小型交通工具。因?yàn)樵诓煌瑘?chǎng)景下,不同人群有不同需求。”在青島自然語(yǔ)義公司聯(lián)合創(chuàng)始人、首席架構(gòu)師孫燕群看來(lái),滿足特定市場(chǎng)的需求,是專而精的小模型興起的重要原因及其存在的價(jià)值。

今年3月,自然語(yǔ)義研發(fā)的Euler模型通過(guò)中央網(wǎng)信辦生成式人工智能服務(wù)備案。不同于大模型動(dòng)輒千億級(jí)的參數(shù)量,Euler的參數(shù)量只有2.5B(25億),是典型的輕量化小模型。相較于大模型,小模型有何特點(diǎn)?應(yīng)用前景如何?記者對(duì)此進(jìn)行了采訪。


(資料圖片僅供參考)

低成本、易調(diào)試的端側(cè)小模型興起

關(guān)于小模型,目前并沒(méi)有明確定義。孫燕群表示,在行業(yè)內(nèi),參數(shù)量低于100B的模型就算比較小的模型。在實(shí)際應(yīng)用時(shí),要想在筆記本電腦端實(shí)現(xiàn)微調(diào),模型參數(shù)量一般在3B左右。

相較大模型,小模型在算力消耗、使用成本方面更具優(yōu)勢(shì)。具體來(lái)說(shuō),一是訓(xùn)練和推理所需的硬件資源較少,使得成本較低;二是使用更便捷,可在手機(jī)、電腦、物聯(lián)網(wǎng)設(shè)備等計(jì)算場(chǎng)景中實(shí)時(shí)運(yùn)行;三是結(jié)構(gòu)簡(jiǎn)單,開發(fā)者能快速定位問(wèn)題,易于調(diào)試。

記者了解到,隨著大模型的比拼日益激烈,一些企業(yè)開始押注小模型。2024年8月,微軟和英偉達(dá)就相繼發(fā)布過(guò)小型語(yǔ)言模型。國(guó)內(nèi)不少企業(yè)也開始研發(fā)在“斷網(wǎng)、弱網(wǎng)”環(huán)境下,讓各種智能終端具備自主思考能力的端側(cè)小模型。例如,在今年3月舉辦的中關(guān)村論壇年會(huì)期間,北京的面壁智能公司就發(fā)布了應(yīng)用于汽車智能座艙的純端側(cè)超級(jí)智能助手。今年1月,廣東佛山移動(dòng)牽頭聯(lián)合40家單位成立佛山市AI小模型產(chǎn)業(yè)聯(lián)合體,致力于通過(guò)人工智能小模型提供個(gè)性化服務(wù),助力企業(yè)完成智能化升級(jí)。

“小模型讓我們實(shí)現(xiàn)了與科技巨頭們的錯(cuò)位競(jìng)爭(zhēng)。”提到小模型的具體應(yīng)用場(chǎng)景,孫燕群舉例說(shuō),Euler通過(guò)備案后,已經(jīng)開始面向中小企業(yè)和個(gè)人用戶提供服務(wù)。如與山東某市級(jí)檔案館合作,上線了檔案模型;與青島當(dāng)?shù)匾患覂x器儀表設(shè)備公司合作,開發(fā)了內(nèi)網(wǎng)技術(shù)相關(guān)的模型。

退而求其次后的“主動(dòng)作為”

“客觀來(lái)說(shuō),大模型的能力強(qiáng)于小模型,一個(gè)參數(shù)量2.5B的模型無(wú)論如何都不可能超過(guò)200B模型的算力。”孫燕群直言,這也是大公司都在做千億級(jí)模型的原因。模型小,神經(jīng)網(wǎng)絡(luò)參數(shù)就少,容納的知識(shí)量不夠,“體現(xiàn)在文本生成上,就是容易出現(xiàn)上下文不連貫的情況”。

自然語(yǔ)義最初的目標(biāo)并不是小模型。2019年底,該公司考慮要做大模型,但由于發(fā)展方向不明朗,同時(shí)在購(gòu)買高算力GPU上面臨資金和貨源壓力,因此未能實(shí)施。

“沒(méi)想到,僅過(guò)了兩年時(shí)間,國(guó)外的大模型就發(fā)布了。”孫燕群回憶說(shuō),后來(lái)隨著越來(lái)越多大企業(yè)涌入大模型賽道,作為基礎(chǔ)硬件的高算力GPU價(jià)格水漲船高。“那段時(shí)間,聽說(shuō)哪里有GPU,我們就坐飛機(jī)去買,常常是提前交了定金也不一定能買到。”最終,公司用10多臺(tái)設(shè)備組成一個(gè)算力集群,能支撐做出7B參數(shù)的模型。

為了在現(xiàn)有設(shè)備基礎(chǔ)上盡可能提高參數(shù),自然語(yǔ)義公司工程師經(jīng)過(guò)頭腦風(fēng)暴,想出了新的分詞方式,以及將向量計(jì)算從實(shí)數(shù)空間轉(zhuǎn)換到復(fù)空間等各種辦法。“經(jīng)過(guò)模型訓(xùn)練,這些技術(shù)都達(dá)到了比較好的效果,能讓一個(gè)3B參數(shù)的模型,達(dá)到了150B參數(shù)模型60%左右的能力。”孫燕群表示。

中國(guó)信息通信研究院人工智能研究所副總工程師王蘊(yùn)韜告訴記者,小模型之所以能在“瘦身”后仍保持可觀性能,得益于一系列成熟的模型壓縮與高效架構(gòu)技術(shù),包括剪枝、量化、知識(shí)蒸餾、設(shè)計(jì)先天高效的網(wǎng)絡(luò)架構(gòu)等。

讓“小身材”跑出“大能量”

“小模型發(fā)展大有可為。”在王蘊(yùn)韜看來(lái),未來(lái)面向特定應(yīng)用場(chǎng)景的小模型,潛力將會(huì)進(jìn)一步釋放。以AI終端為代表的應(yīng)用形態(tài)及產(chǎn)品服務(wù),將成為小模型釋放大能力的主戰(zhàn)場(chǎng)。

關(guān)于小模型的應(yīng)用前景,王蘊(yùn)韜進(jìn)一步解釋,一是為離線辦公、文檔摘要、私密對(duì)話等場(chǎng)景鋪平道路;二是隨著處理器架構(gòu)和神經(jīng)處理單元技術(shù)的應(yīng)用,手機(jī)、車載和物聯(lián)網(wǎng)設(shè)備將成為小模型的天然舞臺(tái);三是在垂直領(lǐng)域與“專精特新”行業(yè),如金融、醫(yī)療、法律、教育等已出現(xiàn)6B及以下參數(shù)的定制模型,成本低、上線快,可在特定任務(wù)上反超通用大模型。

“市場(chǎng)關(guān)心的是能否解決實(shí)際問(wèn)題,不關(guān)心背后模型細(xì)節(jié),能夠與場(chǎng)景深度結(jié)合,擁有行業(yè)知識(shí),尤其是可信的小模型至關(guān)重要。”王蘊(yùn)韜說(shuō)。

從用戶端來(lái)看,在實(shí)際應(yīng)用中,小模型的性價(jià)比優(yōu)勢(shì)也十分明顯。北京某互聯(lián)網(wǎng)公司算法工程師張先生向記者表示,在現(xiàn)有技術(shù)條件下,想要在本地部署大模型存在一定難度。“專業(yè)GPU芯片價(jià)格太高,無(wú)法應(yīng)用到低價(jià)格的終端上,如手機(jī)、機(jī)器人等配備的芯片就無(wú)法撐起大模型。另外,這些終端所配備的電池,往往也支撐不了高性能芯片的耗電等。”張先生表示,這些硬件性能有限的終端,更適合小模型施展。

王蘊(yùn)韜分析認(rèn)為,未來(lái)將是大小模型混合的系統(tǒng)范式。“云端大模型負(fù)責(zé)通用推理,端側(cè)小模型承擔(dān)即時(shí)響應(yīng)與私域數(shù)據(jù)處理。”他還強(qiáng)調(diào),小模型并非“大模型的低配版”,而是面向資源受限環(huán)境與專用任務(wù)的高性價(jià)比解法。通過(guò)配合端云混合部署和行業(yè)數(shù)據(jù)精調(diào),企業(yè)完全可以讓“小身材”跑出“大能量”,在AI商業(yè)落地的下一程中獲得確定性收益。

標(biāo)簽:

搶先讀

相關(guān)文章

熱文推薦

精彩放送

關(guān)于我們| 聯(lián)系我們| 投稿合作| 法律聲明| 廣告投放

版權(quán)所有© 2011-2023  產(chǎn)業(yè)研究網(wǎng)  m.www-332159.com

所載文章、數(shù)據(jù)僅供參考.本站不作任何非法律允許范圍內(nèi)服務(wù)!

聯(lián)系我們:39 60 29 14 2 @qq.com

皖I(lǐng)CP備2022009963號(hào)-13


九江县| 富川| 武穴市| 德令哈市| 电白县| 岳阳县| 巴中市| 冀州市| 郧西县| 武威市| 澄江县| 武强县| 巫山县| 秦安县| 瑞金市| 获嘉县| 威远县| 水富县| 鹿邑县| 开鲁县| 长寿区| 拉孜县| 墨玉县| 将乐县| 旬阳县| 罗山县| 繁昌县| 临漳县| 西昌市| 湛江市| 周口市| 广平县| 土默特右旗| 远安县| 新绛县| 道孚县| 黄陵县| 徐州市| 资兴市| 汾阳市| 乌审旗|