大模型“獨(dú)角獸”亟須差異化應(yīng)對(duì)價(jià)格沖擊
效率成為行業(yè)關(guān)鍵詞
日前,杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司(DeepSeek)推出的新一代大模型DeepSeek-V3,因其訓(xùn)練成本之低引發(fā)行業(yè)熱議。從其正式發(fā)布的技術(shù)報(bào)告來(lái)看,包括預(yù)訓(xùn)練、上下文長(zhǎng)度外推和后訓(xùn)練在內(nèi),DeepSeek-V3完整訓(xùn)練只需2.788M H800 GPU小時(shí)。假設(shè)H800 GPU的租金為每GPU小時(shí)2美元,其總訓(xùn)練成本僅為557萬(wàn)美元。不過(guò),Deepseek也透露,上述成本不包括與架構(gòu)、算法或數(shù)據(jù)相關(guān)的先前研究以及精簡(jiǎn)實(shí)驗(yàn)的成本。
美國(guó)人工智能公司Anthropic的CEO達(dá)里奧·阿莫迪曾透露,GPT-4o這樣的模型訓(xùn)練成本約為1億美元,這意味著DeepSeek的成本只有GPT-4o的1/20。
訓(xùn)練成本降低的同時(shí),DeepSeek-V3卻保持了高性能。根據(jù)其公告,DeepSeek-V3多項(xiàng)評(píng)測(cè)成績(jī)均表現(xiàn)優(yōu)秀,性能與世界頂尖的閉源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。
為什么DeepSeek-V3能夠?qū)崿F(xiàn)低成本、高性能?“包括模型架構(gòu)、基礎(chǔ)設(shè)施優(yōu)化、數(shù)據(jù)優(yōu)化在內(nèi),DeepSeek-V3從端到端都進(jìn)行了工程優(yōu)化,疊加后呈現(xiàn)出很好的效果。”Gartner研究總監(jiān)閆斌介紹說(shuō),大模型進(jìn)入公眾視野時(shí)間尚短,只有兩年多時(shí)間。期間,行業(yè)模型訓(xùn)練相對(duì)粗放,通過(guò)盡量多收集數(shù)據(jù),建設(shè)更大的數(shù)據(jù)中心,以獲得更好的訓(xùn)練結(jié)果,行業(yè)也用“Scaling Law”總結(jié)這一過(guò)程。
“DeepSeek-V3證明,通過(guò)更好的工程化能力,我們可以通過(guò)相對(duì)較少的算力資源、較小的模型,也可以達(dá)到不錯(cuò)的訓(xùn)練效果。”閆斌認(rèn)為,“目前行業(yè)在數(shù)據(jù)和算法方面仍有優(yōu)化空間,低成本的訓(xùn)練和高效推理應(yīng)用或?qū)⑹窍乱浑A段大模型發(fā)展的方向之一。”
值得關(guān)注的是,伯克利大學(xué)NovaSky團(tuán)隊(duì)也剛剛發(fā)布了Sky-T1-32B-Preview開源模型,在常見的推理和編碼基準(zhǔn)測(cè)試中,與OpenAI的o1-preview“平分秋色”。據(jù)稱,其訓(xùn)練成本不到450美元,展示了以經(jīng)濟(jì)高效的方式復(fù)制高水平推理能力的可能性。
NovaSky團(tuán)隊(duì)能夠以如此低成本進(jìn)行模型訓(xùn)練,其關(guān)鍵之處包括使用了數(shù)據(jù)篩選機(jī)制,如通過(guò)QwQ-32B-Preview生成初始數(shù)據(jù),通過(guò)GPT-4o-mini重寫數(shù)據(jù)格式等。此外,NovaSky團(tuán)隊(duì)選擇了Qwen2.5-32B-Instruct作為基礎(chǔ)模型進(jìn)行訓(xùn)練。行業(yè)人士評(píng)價(jià)稱,“這個(gè)項(xiàng)目證明,高水平AI研發(fā)不需要天價(jià)預(yù)算。”
瑞銀證券中國(guó)軟件分析師張維璇說(shuō):“效率是2025年大模型行業(yè)的關(guān)鍵詞之一。除了少數(shù)公司有能力、有愿景用萬(wàn)卡,乃至十萬(wàn)卡繼續(xù)追求頂級(jí)大模型,大多數(shù)公司未來(lái)要降本增效。事實(shí)上,優(yōu)化注意力機(jī)制、采用MOE架構(gòu)、降低模型激活的參數(shù)量等,都已經(jīng)是很主流的降本方式。我們相信這會(huì)帶來(lái)AI門檻的降低,以及技術(shù)的普及化,不僅體現(xiàn)在應(yīng)用側(cè),還有研發(fā)側(cè)。”
大模型創(chuàng)業(yè)公司將直面降價(jià)沖擊
伴隨著訓(xùn)練成本的降低,DeepSeek-V3的API價(jià)格目前為每百萬(wàn)輸入tokens 0.5元(緩存命中)/2元(緩存未命中),每百萬(wàn)輸出tokens 8元。同時(shí),DeepSeek提供了45天優(yōu)惠價(jià)格體驗(yàn)期,在2025年2月8日之前,所有用戶使用DeepSeek-V3 API的價(jià)格分別下降了80%(輸入命中)、50%(輸入未命中)、75%(輸出)。
事實(shí)上,2024年上半年中國(guó)大模型價(jià)格競(jìng)爭(zhēng)的發(fā)起者正是DeepSeek。2024年5月,DeepSeek率先宣布降價(jià),其發(fā)布的第二代MoE大模型DeepSeek-V2定為0.001元/千tokens的輸入價(jià)格與0.002元/千tokens的輸出價(jià)格。隨后,智譜AI、火山引擎、阿里云、百度、科大訊飛、騰訊云等國(guó)內(nèi)主要大模型廠商迅速跟進(jìn)。
可以看到,2024年年底,除了DeepSeek-V3新版本的推出以及API價(jià)格調(diào)整,國(guó)內(nèi)大模型其他廠商也在降價(jià)。2024年12月31日,阿里云宣布2024年度第三輪大模型降價(jià),通義千問(wèn)視覺理解模型全線降價(jià)超80%,其中,Qwen-VL-Plus直降81%;更高性能的Qwen-VL-Max降幅高達(dá)85%。此前,在12月18日舉辦的火山引擎Force大會(huì)上,字節(jié)推出的豆包視覺理解模型也宣布進(jìn)行降價(jià)。
“大模型的不斷降價(jià),無(wú)疑有利于吸引更多企業(yè)使用新的技術(shù),為大模型創(chuàng)業(yè)公司提供了更大的市場(chǎng)。同時(shí),這也對(duì)大模型創(chuàng)業(yè)公司構(gòu)成了挑戰(zhàn)。‘獨(dú)角獸’僅僅做到提升大模型能力還不夠,還要不斷優(yōu)化算法,快速降低模型的推理成本。只有真正做到為用戶提供更有性價(jià)比的大模型服務(wù),才能贏得市場(chǎng)份額。”MiniMax副總裁劉華說(shuō)。
經(jīng)過(guò)一年多來(lái)的行業(yè)競(jìng)爭(zhēng),中國(guó)人工智能大模型的行業(yè)格局不斷清晰,主要玩家從“百模大戰(zhàn)”時(shí)代不斷收斂。MiniMax與智譜AI、百川智能、月之暗面、階躍星辰、零一萬(wàn)物6家行業(yè)“獨(dú)角獸”企業(yè)估值均超10億美元,被行業(yè)稱為國(guó)內(nèi)“大模型六小虎”;再加上關(guān)注度較高的幻方和面壁智能,以及互聯(lián)網(wǎng)大廠中的字節(jié)、阿里、百度和騰訊,行業(yè)主要玩家縮減到十來(lái)家。
API接口調(diào)用付費(fèi)是大模型企業(yè)B端重要商業(yè)化實(shí)現(xiàn)路徑之一。不過(guò),ToB業(yè)務(wù)中,由于互聯(lián)網(wǎng)大廠可以將AI功能綁定算力和云服務(wù)業(yè)務(wù),二者疊加商業(yè)推廣效率更高。因此,在“價(jià)格戰(zhàn)”中,大廠因?yàn)闃I(yè)務(wù)復(fù)合、資金雄厚,也更有優(yōu)勢(shì)。面對(duì)價(jià)格競(jìng)爭(zhēng),創(chuàng)業(yè)公司只能化壓力為動(dòng)力,從加快迭代模型、不斷優(yōu)化算法中尋找解法。
“如果要拼低價(jià)和資源,創(chuàng)業(yè)公司肯定不如大廠。下一步,大模型創(chuàng)業(yè)公司可以聚焦在提供個(gè)性化服務(wù),比如提供情感類大模型的API接口。”行業(yè)人士對(duì)記者表示。
“獨(dú)角獸”還需差異化發(fā)展
無(wú)疑,大模型訓(xùn)練成本、推理成本的下降,將進(jìn)一步加快行業(yè)場(chǎng)景應(yīng)用落地。事實(shí)上,尋找更合適的大規(guī)模落地場(chǎng)景、更好的商業(yè)閉環(huán)模式,已經(jīng)成為大模型企業(yè)下一階段發(fā)展的當(dāng)務(wù)之急。
在接受采訪時(shí),多位行業(yè)人士提到,上述“大模型六小虎”開始出現(xiàn)分化,已有獨(dú)角獸企業(yè)出現(xiàn)“掉隊(duì)”勢(shì)頭,“這也說(shuō)明,大模型行業(yè)發(fā)展遇到了瓶頸。”
“從全球來(lái)看,大模型企業(yè)都面臨一定的融資壓力。大模型出現(xiàn)之初,大家對(duì)它的預(yù)期很高,后面又經(jīng)歷了預(yù)期的回調(diào)。與此同步,行業(yè)融資熱度稍降。當(dāng)然這也符合一項(xiàng)新技術(shù)的發(fā)展曲線。單純通過(guò)講故事已經(jīng)很難找到投資人。”閆斌表示。
從B端應(yīng)用來(lái)看,Gartner的一份最新調(diào)研結(jié)果顯示,截至2024年6月,只有8%的中國(guó)企業(yè)將生成式人工智能部署在生產(chǎn)環(huán)境中。對(duì)此,閆斌解釋稱,目前大模型在中國(guó)企業(yè)生產(chǎn)場(chǎng)景中小規(guī)模落地已出現(xiàn),但大規(guī)模企業(yè)落地仍然較為少見。“如果把最終落地應(yīng)用比作一場(chǎng)考試,那么大模型能力、數(shù)據(jù)、工程化、產(chǎn)品設(shè)計(jì)將是幾門關(guān)鍵課程。根據(jù)我們觀察,國(guó)內(nèi)很多大模型能力已經(jīng)不錯(cuò),目前落地短板更聚焦在其他幾個(gè)方面。”
再來(lái)看C端的落地情況。根據(jù)AI產(chǎn)品榜數(shù)據(jù),目前用戶量排名靠前的應(yīng)用分別為抖音的豆包、MiniMax的Talkie AI、月之暗面的Kimi智能助手、百度的文小言,全球2024年12月的月活分別為7117萬(wàn)、2977萬(wàn)、1669萬(wàn)、1347萬(wàn),在全球主要C端產(chǎn)品榜單中,分別位列第2位、第4位、第15位、第20位。
與創(chuàng)業(yè)“獨(dú)角獸”相比,“大廠”在C端應(yīng)用推廣上,展示出了流量和資本方面的巨大優(yōu)勢(shì)。字節(jié)2024年5月才推出AI對(duì)話助手“豆包”,憑借投流買量后來(lái)居上,成為過(guò)去半年增長(zhǎng)最快的移動(dòng)應(yīng)用。“一些創(chuàng)業(yè)公司此前通過(guò)投流買量的方式迅速擴(kuò)大了用戶量。但隨著‘大廠’下場(chǎng),這種做法就顯得不那么劃算了。”有行業(yè)人士對(duì)記者表示。
“目前國(guó)內(nèi)大模型企業(yè)的C端產(chǎn)品存在‘同質(zhì)化’的問(wèn)題,很多企業(yè)都推出了AI對(duì)話助手類產(chǎn)品,功能大同小異。但是,大模型技術(shù)在不斷迭代。各家企業(yè)需要基于大模型能力的提升趨勢(shì),去探索新的AI產(chǎn)品形態(tài),去滿足客戶尚未被滿足的需要。尤其是創(chuàng)業(yè)公司,更是要把資源聚焦于技術(shù)和產(chǎn)品的創(chuàng)新,而不是通過(guò)投流買量進(jìn)入變成‘紅海’的賽道。”劉華說(shuō)。
標(biāo)簽:
搶先讀
- 大模型“獨(dú)角獸”亟須差異化應(yīng)對(duì)價(jià)格沖擊
- 880萬(wàn)架 算力產(chǎn)業(yè)量質(zhì)齊升
- 中外團(tuán)隊(duì)“聽”到遙遠(yuǎn)太空合聲波
- 880萬(wàn)架 算力產(chǎn)業(yè)量質(zhì)齊升
- 知識(shí)產(chǎn)權(quán)領(lǐng)域2024交出“高分答卷”
- 星空有約|人類首次!“天關(guān)”衛(wèi)星探測(cè)到宇宙早期爆發(fā)的軟X射線信號(hào)
- 2024年制造業(yè)產(chǎn)品質(zhì)量合格率為93.93%
- “文化+科技”助推假日經(jīng)濟(jì)持續(xù)繁榮
- “文化+科技”助推假日經(jīng)濟(jì)持續(xù)繁榮
- 大模型身瘦路更寬
- 促進(jìn)平臺(tái)經(jīng)濟(jì)持續(xù)健康發(fā)展
- 量子計(jì)算機(jī)距廣泛應(yīng)用還遠(yuǎn)嗎
- 科學(xué)家成功解析大腦掌管學(xué)習(xí)記憶的“分子開關(guān)”
- 科學(xué)家成功解析大腦掌管學(xué)習(xí)記憶的“分子開關(guān)”
- 河南西峽農(nóng)商銀行金融備戰(zhàn)“春節(jié)假日游”
- 新野縣王集鎮(zhèn):新春慰問(wèn)暖人心
- 西峽縣法院召開2025年度司法白皮書、司法建議書、優(yōu)秀文書、優(yōu)秀案例工作推進(jìn)會(huì)
- 駐馬店市驛城區(qū)朱古洞鄉(xiāng):“兜”住困難群體 春節(jié)慰問(wèn)暖民心
- 鄧州市法院:想方設(shè)法解“薪”愁 安心過(guò)年不憂“薪”
- 鎮(zhèn)平縣法院:暖心調(diào)解“案中案” 錦旗相送謝意傳
- 南陽(yáng)宛城區(qū)法院:夜間普法忙 送法暖人心
- 駐馬店市驛城區(qū)東風(fēng)街道雪松路東段社區(qū):慰問(wèn)暖人心 爭(zhēng)創(chuàng)幸福和諧星
- 行車記錄儀把卡拔了里面有沒有記錄?手機(jī)查看行車記錄儀怎么弄?
- 冬天玻璃水凍住了咋辦?雨刮器能動(dòng)但是不噴水是咋回事?
- 瓜田李下打一生肖答案是什么?亡羊補(bǔ)牢打一生肖答案是什么?
- 民不卿生的含義是什么?民不卿生的反義詞是什么?
- 與世隔絕的絕是什么意思?絡(luò)繹不絕的絕是什么意思?
- 起子是什么意思呢?起子與螺絲刀的區(qū)別是什么?
- 2024年度山西省級(jí)中小企業(yè)園名單出爐
- 北京2024年萬(wàn)元GDP用水量降低至8.45立方米
- 中國(guó)考古博物館推出云展覽 八千年龍文化精品文物永久展示
- 制造業(yè)的涵蓋范圍有哪些?采購(gòu)經(jīng)理指數(shù)是什么意思?
- 嶺南詩(shī)人劉斯翰講述父親《唐詩(shī)小札》的成功密碼
- 王鶴棣:像許七安一樣熱血闖蕩
- 全國(guó)首個(gè)荊楚文化主題室內(nèi)沉浸式演藝街區(qū)開街
- 犯罪懸疑劇《余燼之上》定檔 王子奇孫陽(yáng)共赴人性歷險(xiǎn)
- 全國(guó)首個(gè)荊楚文化主題室內(nèi)沉浸式演藝街區(qū)開街
- “電影+旅游”新消費(fèi)場(chǎng)景拓展延伸 釋放春節(jié)文旅市場(chǎng)活力
- “電影+旅游”新消費(fèi)場(chǎng)景拓展延伸 釋放春節(jié)文旅市場(chǎng)活力
- (新春走基層)杭州德壽宮“紋樣”迎春 以“屏”會(huì)友共賞宋韻年
- (新春走基層)杭州德壽宮“紋樣”迎春 以“屏”會(huì)友共賞宋韻年
- 1月廣州新建商品房網(wǎng)簽面積同比增長(zhǎng)37%
- 春節(jié)檔武俠電影《射雕英雄傳:俠之大者》曝特別預(yù)告
- 海南民宿預(yù)訂火熱 春節(jié)前平均入住率達(dá)80%
- 寧波阪急開年彩蛋,20+新店快速入駐,解鎖蛇年春節(jié)新玩法
- “蛇”我其誰(shuí)!臺(tái)灣春節(jié)熱播《甄嬛傳》
- “蛇”我其誰(shuí)!臺(tái)灣春節(jié)熱播《甄嬛傳》
- 劉廣迎新作探討“足球美學(xué)”與中國(guó)足球經(jīng)營(yíng)之道
- 《票友大會(huì)》以“聲”入戲 呈現(xiàn)鮮活票友群像
- 劉廣迎新作探討“足球美學(xué)”與中國(guó)足球經(jīng)營(yíng)之道
- 文明的坐標(biāo)丨“這里的先民8000多年前就種水稻”有實(shí)證
- 文明的坐標(biāo)丨“這里的先民8000多年前就種水稻”有實(shí)證
- 文明的坐標(biāo)丨“這里的先民8000多年前就種水稻”有實(shí)證
- (新春見聞)古籍整理讓古書“活”在當(dāng)下
- (新春見聞)古籍整理讓古書“活”在當(dāng)下
- 第十二屆景泰藍(lán)皇家藝術(shù)廟會(huì)大年初二開鑼一展大師新作
- “蛇”我其誰(shuí)!臺(tái)灣春節(jié)熱播《甄嬛傳》
- (新春走基層)福建永定土樓人家張燈結(jié)彩迎新年
- (新春見聞)古籍整理讓古書“活”在當(dāng)下
- 內(nèi)蒙古阿爾寨石窟遺址出土罕見遺物
- 內(nèi)蒙古阿爾寨石窟遺址出土罕見遺物
- (新春走基層)“遇見敦煌”首秀天津 傳統(tǒng)與科技碰撞出新春“火花”
- 內(nèi)蒙古阿爾寨石窟遺址出土罕見遺物
- (新春走基層)福建永定土樓人家張燈結(jié)彩迎新年
- “群星點(diǎn)亮的夜空——波斯文化藝術(shù)五千年”特展在蓉開幕
- (新春走基層)“遇見敦煌”首秀天津 傳統(tǒng)與科技碰撞出新春“火花”
- 房地產(chǎn)稅收新政策實(shí)施首月新增減免稅116.9億元
- (新春走基層)“遇見敦煌”首秀天津 傳統(tǒng)與科技碰撞出新春“火花”
- 13.8萬(wàn)億元、792萬(wàn)名……多組數(shù)字背后盡顯消費(fèi)市場(chǎng)活力足、需求旺
- 中馬2024年雙邊貿(mào)易額創(chuàng)歷史新高
- 13.8萬(wàn)億元、792萬(wàn)名……多組數(shù)字背后盡顯消費(fèi)市場(chǎng)活力足、需求旺
- 家國(guó)同春·四海共享丨劍南春高勢(shì)能營(yíng)銷引爆春節(jié)檔熱潮
- 陽(yáng)江帆石一海上風(fēng)電項(xiàng)目首臺(tái)風(fēng)機(jī)基礎(chǔ)開始打樁
- 爸媽新任務(wù):搶演唱會(huì)門票!“銀發(fā)經(jīng)濟(jì)”有了這些新趨勢(shì)→
- 浙江義烏去年GDP2503.5億元 同比增7.5%
- 降本增效再加力 “流動(dòng)中國(guó)”顯活力
- 降本增效再加力 “流動(dòng)中國(guó)”顯活力
- 降本增效再加力 “流動(dòng)中國(guó)”顯活力
- 降本增效再加力 “流動(dòng)中國(guó)”顯活力
- 吃完這些藥誰(shuí)勸都別喝酒,不只頭孢→
- 吃完這些藥誰(shuí)勸都別喝酒,不只頭孢→
- 首兒所與首都體育學(xué)院合作啟用兒童體醫(yī)融合中心
- 多地實(shí)現(xiàn)藥品價(jià)格在手機(jī)上一鍵查詢、實(shí)時(shí)比對(duì)、位置導(dǎo)航
- 廣西南寧市居民健康素養(yǎng)水平實(shí)現(xiàn)“九連升”
- 專家教你如何預(yù)防呼吸道疾病,安然過(guò)年
- 未來(lái)十年教育領(lǐng)域如何發(fā)展?專家解讀教育強(qiáng)國(guó)建設(shè)規(guī)劃綱要
- 走出校園打通法律援助的“最后一公里”
- 走出校園打通法律援助的“最后一公里”
- 給予畢業(yè)生更從容的擇業(yè)期(暖聞熱評(píng))
- 多所名校公布升學(xué)數(shù)據(jù),本科生不愛留學(xué)了?
- 天津多舉措激發(fā)高校創(chuàng)新創(chuàng)業(yè)活力
- 內(nèi)陸省份甘肅,職教如何揚(yáng)帆出海?
- 內(nèi)陸省份甘肅,職教如何揚(yáng)帆出海?
- 給予畢業(yè)生更從容的擇業(yè)期(暖聞熱評(píng))
- 報(bào)告:職業(yè)教育國(guó)際創(chuàng)新趨勢(shì)表現(xiàn)在公共產(chǎn)品化等八個(gè)方面
- 報(bào)告:職業(yè)教育國(guó)際創(chuàng)新趨勢(shì)表現(xiàn)在公共產(chǎn)品化等八個(gè)方面
- 教育部:確保每所學(xué)校至少有1名科學(xué)副校長(zhǎng) 配齊配優(yōu)科學(xué)類課程教師
- 吃完這些藥誰(shuí)勸都別喝酒,不只頭孢→
- 2024年食品安全與健康流言榜發(fā)布 這些都是真的嗎?真相來(lái)了
- 上海率先籌建胎兒醫(yī)院 推動(dòng)產(chǎn)科、兒科融合發(fā)展