亚洲精品无码乱码成人|最近中文字幕免费大全|日韩欧美卡一卡二卡新区|熟妇性饥渴一区二区三区|久久久久无码精品国产AV|欧美日韩国产va在线观看|久久精品一本到99热动态图|99国产精品欧美一区二区三区

您現(xiàn)在的位置是: 專題 > > 正文

大模型既要“吃得飽”更要“吃得好”

時間:2025-03-03 12:22:36 來源:科技日報(bào) 發(fā)布者:DN032
前段時間,網(wǎng)絡(luò)上流傳著一些由大模型生成的“異次元篇章”。比如,有人讓大模型續(xù)寫《紅樓夢》情節(jié)時,竟得出一幕“賈寶玉倒拔垂楊柳”的奇景,令人啼笑皆非。之所以會出現(xiàn)這種“混搭”和“幻覺”,是因?yàn)榇竽P筒粌H學(xué)習(xí)了原著,還“廣納博采”了不少錯誤信息。

這些人工智能(AI)生成的“胡言亂語”雖是網(wǎng)友們茶余飯后的笑談,但提醒我們要清醒認(rèn)識到其背后折射出的問題:數(shù)據(jù)質(zhì)量是大模型應(yīng)用成敗的關(guān)鍵。以個性化推薦AI系統(tǒng)為例,一些企業(yè)在開發(fā)過程中,雖然收集了大量的用戶行為數(shù)據(jù),但數(shù)據(jù)中充斥著錯誤的標(biāo)注、重復(fù)的數(shù)據(jù)以及相互矛盾的信息,數(shù)據(jù)的量增加了,但系統(tǒng)推薦的準(zhǔn)確性并沒有顯著提升?!蹲匀弧冯s志(Nature)刊登的一篇有關(guān)大模型可靠性研究的文章指出,一個西班牙研究團(tuán)隊(duì)發(fā)現(xiàn),包括OpenAI公司的GPT在內(nèi)的幾個大模型升級后,雖然參數(shù)量更大了,誤答情況卻更嚴(yán)重了。因此,大模型長得壯不壯,不僅取決于“食量”(即數(shù)據(jù)的數(shù)量),更在于食物的“質(zhì)量”(即數(shù)據(jù)的質(zhì)量)——吃得飽并不等同于吃得好。

數(shù)據(jù)是大模型的基石,在數(shù)據(jù)質(zhì)量不高、可靠性缺失的情況下,一味追求大模型參數(shù)量的增加,不僅無法提升模型性能,反而會放大偏差和謬誤,產(chǎn)生更多不可信數(shù)據(jù)。如此一來,勢必造成計(jì)算與存儲資源的浪費(fèi),增加開發(fā)和維護(hù)成本,降低用戶信任度。更為嚴(yán)重的是,這種“大模型幻覺”和“災(zāi)難性遺忘”現(xiàn)象如果發(fā)生在精確性要求極高的工業(yè)生產(chǎn)領(lǐng)域中,還可能引發(fā)不可預(yù)測的風(fēng)險和隱患。以油氣勘探為例,基于大模型給出的錯誤預(yù)測進(jìn)行開采可能導(dǎo)致數(shù)億元的資金損失,并對自然環(huán)境造成不可逆轉(zhuǎn)的破壞。

提升大模型性能,關(guān)鍵是處理好數(shù)據(jù)“質(zhì)”和“量”的關(guān)系,構(gòu)建大規(guī)模、高質(zhì)量的數(shù)據(jù)集。應(yīng)建立完善的數(shù)據(jù)收集、清洗、驗(yàn)證和存儲機(jī)制,加強(qiáng)對數(shù)據(jù)質(zhì)量的監(jiān)控和評估,確保數(shù)據(jù)的準(zhǔn)確性、完整性和一致性。此外,還應(yīng)注重跨領(lǐng)域合作,引入數(shù)據(jù)科學(xué)家、AI算法工程師等多方力量,開展大模型算法合作、制定數(shù)據(jù)共享和隱私安全保密協(xié)議,推動大模型產(chǎn)學(xué)研用生態(tài)建設(shè)。

如今,大模型的發(fā)展已邁入多模態(tài)融合階段。通過加強(qiáng)數(shù)據(jù)治理,優(yōu)化人工智能學(xué)習(xí)、訓(xùn)練和驗(yàn)證的“基礎(chǔ)食材”,端上大規(guī)模、高質(zhì)量、多模態(tài)數(shù)據(jù)集的“豐盛大餐”,必將助力大模型能力的提升,讓人工智能更好地賦能千行百業(yè)、造福人類社會。

標(biāo)簽:

搶先讀

相關(guān)文章

熱文推薦

精彩放送

關(guān)于我們| 聯(lián)系我們| 投稿合作| 法律聲明| 廣告投放

版權(quán)所有© 2011-2023  產(chǎn)業(yè)研究網(wǎng)  m.www-332159.com

所載文章、數(shù)據(jù)僅供參考.本站不作任何非法律允許范圍內(nèi)服務(wù)!

聯(lián)系我們:39 60 29 14 2 @qq.com

皖I(lǐng)CP備2022009963號-13


石屏县| 宁陵县| 太保市| 登封市| 新竹市| 荣昌县| 永吉县| 景谷| 忻州市| 张家口市| 吉木乃县| 鄱阳县| 金平| 峨眉山市| 丹江口市| 周至县| 永年县| 延长县| 江门市| 隆林| 龙江县| 城固县| 丘北县| 宜兰市| 临武县| 汨罗市| 麟游县| 桑植县| 通州区| 乌恰县| 肇州县| 南城县| 祁连县| 迁西县| 苗栗县| 南丹县| 来安县| 静乐县| 南宁市| 靖远县| 泰宁县|