AI成為數(shù)學(xué)家得力助手還要多久
幾百年來,數(shù)學(xué)家使用的工具依然簡(jiǎn)樸:一張紙、一支筆。他們憑借邏輯與靈感,在符號(hào)的迷宮中尋找通往真理的路徑。
為了打破這一局面,美國(guó)國(guó)防高級(jí)研究計(jì)劃局今年4月啟動(dòng)了“指數(shù)性數(shù)學(xué)”計(jì)劃,旨在開發(fā)一種能極大提升數(shù)學(xué)研究效率的人工智能(AI)“合著者”系統(tǒng)。
幾十年來,數(shù)學(xué)家借助計(jì)算機(jī)進(jìn)行輔助計(jì)算或驗(yàn)證命題,如今的AI或許能更上層樓,挑戰(zhàn)那些人類長(zhǎng)年未解的難題。不過,從能解高中題的AI,到能協(xié)助攻克前沿?cái)?shù)學(xué)難關(guān)的AI,中間仍隔著一道鴻溝。
圖片來源:物理學(xué)家組織網(wǎng)
解決重大難題仍力不從心
大型語言模型(LLM)并不擅長(zhǎng)數(shù)學(xué)。它們常常出現(xiàn)“幻覺”,甚至可能被誤導(dǎo)相信2+2=5。但新一代大型推理模型,如OpenAI的o3、Anthropic的Claude 4 Thinking等,展現(xiàn)出的進(jìn)步令數(shù)學(xué)家眼前一亮。
今年,這些模型在美國(guó)數(shù)學(xué)邀請(qǐng)賽中的表現(xiàn)接近優(yōu)秀高中生水平。不同于過去“一錘定音”式的輸出,這些模型開始嘗試模擬數(shù)學(xué)家逐步推理的思考過程。
同時(shí),一些將LLM與某種事實(shí)核查系統(tǒng)相結(jié)合的新型混合模型也取得了突破。例如,谷歌“深度思維”的AlphaProof系統(tǒng)將語言模型與棋類AI——AlphaZero結(jié)合,成為首個(gè)取得與國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽銀牌得主成績(jī)相當(dāng)?shù)南到y(tǒng)。今年5月,谷歌的AlphaEvolve模型更進(jìn)一步,在多個(gè)長(zhǎng)期未解的數(shù)學(xué)與計(jì)算難題上找到優(yōu)于人類現(xiàn)有方案的解法。
美國(guó)《麻省理工科技評(píng)論》指出,盡管這些AI成績(jī)亮眼,但專家們普遍認(rèn)為,它們?nèi)圆痪邆湔嬲膮f(xié)助科研的能力。競(jìng)賽題雖難,卻更像是智力游戲,有一定“套路”。真正的數(shù)學(xué)研究則更開放、更復(fù)雜。面對(duì)“P vs NP”“黎曼猜想”等重大難題時(shí),AI仍力不從心。
為了更準(zhǔn)確地評(píng)估AI的能力,初創(chuàng)公司Epoch AI去年推出了FrontierMath測(cè)試,聯(lián)合60多位數(shù)學(xué)家設(shè)計(jì)出全新高難度題目,避開模型已見過的訓(xùn)練數(shù)據(jù),結(jié)果LLM幾乎集體“交白卷”。
這些測(cè)試表明,AI在數(shù)學(xué)道路上雖已邁步,但離“合著者”角色仍有很長(zhǎng)一段路要走。
需攻克“超長(zhǎng)推理鏈”
仔細(xì)觀察數(shù)學(xué)問題會(huì)發(fā)現(xiàn),它們?cè)谀承┓矫骖愃疲航鉀Q問題需完成一系列連續(xù)步驟,關(guān)鍵在于找到這些步驟。
美國(guó)加州理工學(xué)院謝爾蓋·古科夫指出,困難的差異往往體現(xiàn)在路徑的長(zhǎng)度上。高中數(shù)學(xué)可能只需10到40步,而像黎曼猜想這樣的難題,路徑可能長(zhǎng)達(dá)百萬步。
這類“超長(zhǎng)路徑”極難處理。就像下圍棋時(shí)尋找一條制勝序列,AI必須在指數(shù)級(jí)增長(zhǎng)的可能路徑中找到正確解法。而在數(shù)學(xué)中,這個(gè)復(fù)雜度要遠(yuǎn)超棋類游戲。
據(jù)物理學(xué)家組織網(wǎng)今年2月報(bào)道,為應(yīng)對(duì)這一挑戰(zhàn),古科夫團(tuán)隊(duì)開發(fā)了一種方法,將多個(gè)步驟打包成“超級(jí)步驟”,相當(dāng)于穿上“巨人靴”跨越大段路程。他們?cè)O(shè)計(jì)了一個(gè)系統(tǒng),其中強(qiáng)化學(xué)習(xí)模型負(fù)責(zé)提出超級(jí)步驟,另一個(gè)模型負(fù)責(zé)驗(yàn)證其合理性。
該策略在經(jīng)典未解難題——安德魯斯-柯蒂斯猜想上取得了突破。雖然尚未證明或推翻該猜想,但借助AI,科學(xué)家推翻了一個(gè)40年來被廣泛引用的“反例”。這曾被視為證明該猜想錯(cuò)誤的關(guān)鍵依據(jù)。
牛津大學(xué)數(shù)學(xué)家馬丁·布里森對(duì)此表示肯定:“排除錯(cuò)誤路徑,是科研中非常有價(jià)值的一步。”
古科夫相信,這種“壓縮路徑”的思路適用于所有需要推理鏈條的領(lǐng)域。他希望,這種方法不僅能推動(dòng)AI跳出固有模式,也為數(shù)學(xué)研究帶來新突破。
真正的創(chuàng)新和突破仍屬人類
跳出思維定式,正是數(shù)學(xué)家攻克難題的關(guān)鍵。數(shù)學(xué)常被看作機(jī)械推理,而高等數(shù)學(xué)則更像是一場(chǎng)實(shí)驗(yàn),充滿一波三折的試錯(cuò)與靈光乍現(xiàn)的頓悟。
這正是AlphaEvolve等AI工具的優(yōu)勢(shì)所在。它通過LLM不斷生成并改進(jìn)解題代碼,配合第二個(gè)模型評(píng)估每一輪結(jié)果,最終提出比人類更優(yōu)的解法。這種方法不僅能獨(dú)立探索,也支持人類隨時(shí)介入,提供靈感和指令。
澳大利亞悉尼大學(xué)數(shù)學(xué)家喬迪·威廉姆森強(qiáng)調(diào),探索性思維是數(shù)學(xué)的核心。據(jù)英國(guó)《新科學(xué)家》網(wǎng)站報(bào)道,他與Meta合作開發(fā)了PatternBoost AI系統(tǒng),可根據(jù)一個(gè)數(shù)學(xué)想法生成相似概念,幫助激發(fā)靈感。他說:“這就像是這里有一堆有趣的東西,我不知道是怎么回事,但你能再生成一些類似的東西嗎?”
這種頭腦風(fēng)暴在數(shù)學(xué)中至關(guān)重要,它是新想法產(chǎn)生的源泉。以二十面體為例——古希臘人通過純粹推理發(fā)現(xiàn)了它,其形狀并不存在于自然界中,卻深刻影響了數(shù)學(xué)的發(fā)展。威廉姆森希望,AI未來也能協(xié)助發(fā)現(xiàn)類似的“新數(shù)學(xué)對(duì)象”。
不過,目前AI仍缺乏真正的創(chuàng)造力。讓AI贏棋是一回事,讓它發(fā)明圍棋游戲則是另一回事。像AlphaEvolve和PatternBoost這樣的工具或許能作為人類直覺的“偵察兵”,幫助人們發(fā)現(xiàn)路徑、避開死路,但專家普遍認(rèn)為,真正的創(chuàng)新與突破,仍然屬于人類。
標(biāo)簽:
搶先讀
- AI成為數(shù)學(xué)家得力助手還要多久
- AI成為數(shù)學(xué)家得力助手還要多久
- AI成為數(shù)學(xué)家得力助手還要多久
- 國(guó)產(chǎn)航空明星產(chǎn)品齊聚巴黎航展
- AI成為數(shù)學(xué)家得力助手還要多久
- 從“能用”到“好用”:AI激活醫(yī)療創(chuàng)新動(dòng)能
- 膩?zhàn)釉趺垂斡挚煊制??刮膩?zhàn)右话銕滋炷芨桑?/a>
- AI成為數(shù)學(xué)家得力助手還要多久
- 從“能用”到“好用”:AI激活醫(yī)療創(chuàng)新動(dòng)能
- 中國(guó)千比特超導(dǎo)量子計(jì)算測(cè)控系統(tǒng)完成交付
- 中國(guó)千比特超導(dǎo)量子計(jì)算測(cè)控系統(tǒng)完成交付
- 金錢守恒定律是什么意思?什么是金錢守恒定律?
- 沉浸式是什么意思?沉浸式的意思解釋
- 全國(guó)女婿告狀日是什么梗?什么是全國(guó)女婿告狀日
- 會(huì)飛的雷克薩斯是什么梗?什么是會(huì)飛的雷克薩斯
- 數(shù)學(xué)銳銳是什么梗?什么是數(shù)學(xué)銳銳?
- 水培滴水觀音如何養(yǎng)護(hù)?滴水觀音可以在室內(nèi)養(yǎng)嗎?
- 股票價(jià)格低于1元會(huì)退市嗎?
- 北京市推動(dòng)人工智能賦能新型工業(yè)化
- 什么是基金股?基金股是什么意思?
- 人形機(jī)器人產(chǎn)業(yè)向?qū)嵱眠M(jìn)化
- 偽球迷是什么意思?偽球迷是什么梗?
- 群體免疫是什么意思?什么是群體免疫?
- 數(shù)字適老助殘典型案例推薦工作啟動(dòng)
- 借助高科技 “慧眼”識(shí)文物
- 長(zhǎng)城炮是什么意思?長(zhǎng)城炮是什么梗?
- 翹到可以頂起一瓶汽水是什么梗?翹到可以頂起一瓶汽水是什么意思?
- 公路文是什么意思?什么是公路文?
- 隔夜冰西瓜、冷藏剩米飯 夏天這幾類食物吃不對(duì)可能進(jìn)醫(yī)院
- 生魚片配芥末可以掃光細(xì)菌?丨中新真探
- “心門失守”非小事 專家:心臟瓣膜病早診早治是關(guān)鍵
- 生魚片配芥末可以掃光細(xì)菌?丨中新真探
- 破除青少年體重管理三大誤區(qū)
- 破除青少年體重管理三大誤區(qū)
- 專家:房顫發(fā)病率與年齡增加成正向關(guān)系 改變不良習(xí)慣是防治基礎(chǔ)
- 中新健康丨“日啖荔枝三百顆”可能會(huì)中毒
- 專家:房顫發(fā)病率與年齡增加成正向關(guān)系 改變不良習(xí)慣是防治基礎(chǔ)
- 專家:房顫發(fā)病率與年齡增加成正向關(guān)系 改變不良習(xí)慣是防治基礎(chǔ)
- 推動(dòng)近視管理精細(xì)化發(fā)展 專家建言對(duì)近視兒童“按需管理”
- 楊梅里有蟲不能吃嗎?丨中新真探
- 午睡20分鐘效果最佳!這4個(gè)習(xí)慣反而傷身
- 午睡20分鐘效果最佳!這4個(gè)習(xí)慣反而傷身
- 睡眠不好?以后將有專人來“管”
- 番茄栽培技術(shù)是什么?番茄和圣女果有什么區(qū)別?
- 干花怎么養(yǎng)?做干花要倒掛幾天?
- 冬季梔子花怎么養(yǎng)護(hù)呢?梔子花的花期是什么時(shí)候?
- 山西出臺(tái)藥品醫(yī)療器械監(jiān)管改革新規(guī) 28項(xiàng)舉措促發(fā)展
- 多肉植物怕冷嗎冬季怎么養(yǎng)護(hù)?多肉植物多久澆一次水?
- 國(guó)家衛(wèi)健委:通過無償獻(xiàn)血證小程序共辦理跨省異地血費(fèi)減免的申請(qǐng)上萬例
- 國(guó)家醫(yī)保局印發(fā)《泌尿系統(tǒng)醫(yī)療服務(wù)價(jià)格項(xiàng)目立項(xiàng)指南(試行)》
- 山西出臺(tái)藥品醫(yī)療器械監(jiān)管改革新規(guī) 28項(xiàng)舉措促發(fā)展
- 手上這根“刺”拔不得!不當(dāng)處理會(huì)越長(zhǎng)越多
- 手上這根“刺”拔不得!不當(dāng)處理會(huì)越長(zhǎng)越多
- 糾不正之風(fēng) 14部門發(fā)文瞄準(zhǔn)醫(yī)藥購(gòu)銷領(lǐng)域和醫(yī)療服務(wù)
- 國(guó)家衛(wèi)健委解讀《2025年糾正醫(yī)藥購(gòu)銷領(lǐng)域和醫(yī)療服務(wù)中不正之風(fēng)工作要點(diǎn)》
- 這6個(gè)動(dòng)作真的很傷膝蓋 你可能每天都在做
- 朝“問”健康丨超一半病人發(fā)現(xiàn)即中晚期 警惕“沉默殺手”
- 經(jīng)常缺覺的人全身處于炎癥狀態(tài) 一個(gè)方法幫你緩解
- 被東北人叫做“臭菜”的它,沒想到補(bǔ)鈣還護(hù)眼
- 小伙“教科書式”超強(qiáng)自救 心臟突發(fā)不適他在車上打了三通電話
- 朝“問”健康丨超一半病人發(fā)現(xiàn)即中晚期 警惕“沉默殺手”
- “全副武裝”反致骨質(zhì)疏松 科學(xué)防曬拿捏“分寸”很重要
- 國(guó)家衛(wèi)健委解讀《2025年糾正醫(yī)藥購(gòu)銷領(lǐng)域和醫(yī)療服務(wù)中不正之風(fēng)工作要點(diǎn)》
- 郁金香自然球可以水培不?水培郁金香多長(zhǎng)時(shí)間發(fā)芽?
- 4個(gè)小改變,血脂降了、血糖低了、脂肪肝變好了
- 關(guān)注楊梅季:女子只吃了兩顆楊梅,雙眼就腫成“悲傷蛙”
- 隔夜冰西瓜、冷藏剩米飯 夏天這幾類食物吃不對(duì)可能進(jìn)醫(yī)院
- 這6個(gè)指標(biāo)正常,說明你肝臟健康
- 水培蒜的步驟是什么?水培大蒜不發(fā)芽是咋回事?
- 中新健康丨穿了防曬衣還用涂防曬霜嗎?
- “心門失守”非小事 專家:心臟瓣膜病早診早治是關(guān)鍵
- 警惕潛伏在身體里的“隱形殺手” 預(yù)防肺動(dòng)脈高壓注意這幾點(diǎn)
- “心門失守”非小事 專家:心臟瓣膜病早診早治是關(guān)鍵
- 隔夜冰西瓜、冷藏剩米飯 夏天這幾類食物吃不對(duì)可能進(jìn)醫(yī)院
- 這種常見水果含水量很高,關(guān)鍵還穩(wěn)血糖、不怕胖,適合全家人吃
- 專家:房顫發(fā)病率與年齡增加成正向關(guān)系 改變不良習(xí)慣是防治基礎(chǔ)
- 上海多措并舉讓孩子在體育鍛煉中享受樂趣、錘煉意志
- 這6類你以為健康的素菜,其實(shí)約等于在“吃油”!
- 推動(dòng)近視管理精細(xì)化發(fā)展 專家建言對(duì)近視兒童“按需管理”
- 第六屆全國(guó)科技史學(xué)科點(diǎn)聯(lián)席會(huì)議在廣州舉行
- 睡眠不好?以后將有專人來“管”
- 分批發(fā)放、靈活還款 今年申請(qǐng)助學(xué)貸款有哪些新變化?
- 山東夏季高考試卷總數(shù)超415萬份 選擇題評(píng)閱已全部完成
- 第六屆全國(guó)科技史學(xué)科點(diǎn)聯(lián)席會(huì)議在廣州舉行
- 第八屆全國(guó)職業(yè)院??缇畴娚碳寄艽筚愵C獎(jiǎng)典禮在滬舉行
- 當(dāng)AI來敲門,高等教育如何“開門迎客”?
- 汕頭大學(xué)今年總招生計(jì)劃共4800人 新增7個(gè)招生專業(yè)
- 江蘇:“最美基層高校畢業(yè)生”講述奮斗故事
- 汕頭大學(xué)今年總招生計(jì)劃共4800人 新增7個(gè)招生專業(yè)
- 同濟(jì)大學(xué)推出啟迪書院 致力培養(yǎng)引領(lǐng)工程智能的卓越工程師
- 入學(xué)嘗鮮果畢業(yè)攜碩果 第十屆“暢享園藝”甜蜜送別畢業(yè)生
- 2025年京津冀高校新工科創(chuàng)新成果展在天津舉辦
- 人民幣跨境支付系統(tǒng)(CIPS)與6家外資機(jī)構(gòu)簽約
- 首批新能源車電池逐步到達(dá)“8年質(zhì)保期” 電池報(bào)廢后去哪了?
- 求職遇到“招轉(zhuǎn)貸”怎么辦?人社部回應(yīng)
- 哈大高鐵累計(jì)發(fā)運(yùn)旅客超10億人次
- 企業(yè)資產(chǎn)的變動(dòng)有何影響?資產(chǎn)減值損失是什么科目?
- 求職遇到“招轉(zhuǎn)貸”怎么辦?人社部回應(yīng)
- 6月18日央行開展1563億元7天期逆回購(gòu)操作
- 2025陸家嘴論壇今天開幕 央行宣布八項(xiàng)重磅金融開放舉措