亚洲精品无码乱码成人|最近中文字幕免费大全|日韩欧美卡一卡二卡新区|熟妇性饥渴一区二区三区|久久久久无码精品国产AV|欧美日韩国产va在线观看|久久精品一本到99热动态图|99国产精品欧美一区二区三区

您現(xiàn)在的位置是: 資訊 > > 正文

清華學(xué)霸與AI比做高考?jí)狠S題,誰(shuí)會(huì)贏?

時(shí)間:2025-05-28 17:50:58 來(lái)源:第一財(cái)經(jīng) 發(fā)布者:DN032
去年,“9.11和9.9誰(shuí)大?”這一簡(jiǎn)單的數(shù)學(xué)題曾難倒了多家大模型。到了今年,大模型的理科能力提升如何?

今日網(wǎng)易有道發(fā)布了一則視頻,6位清華姚班學(xué)生與AI比賽做高考?jí)狠S題。清華姚班為圖靈獎(jiǎng)得主姚期智院士創(chuàng)辦,匯聚了數(shù)學(xué)、物理、信息學(xué)競(jìng)賽金牌得主。

姚班學(xué)生和AI競(jìng)速的兩道題分別為2023年高考數(shù)學(xué)全國(guó)一卷壓軸題和2021年高考物理江蘇卷壓軸題。姚班學(xué)生在10分鐘內(nèi)完成了作答,僅有1位同學(xué)做錯(cuò)了題目,AI答疑筆則在輸入確認(rèn)后幾秒就開(kāi)始輸出步驟,并答對(duì)了題目。

對(duì)于AI的回答,一位姚班學(xué)生認(rèn)為AI做題思路與其一致,步驟更加清晰,相較于傳統(tǒng)的答案更有利于學(xué)生理解解題思路。

可以對(duì)比的是,去年高考結(jié)束后,有機(jī)構(gòu)讓包括GPT-4o、豆包、文心4.0在內(nèi)的9家大模型嘗試河南的高考卷,并以河南的分?jǐn)?shù)線(xiàn)評(píng)判,最終有4家大模型在文科高考中達(dá)到河南的一本線(xiàn),但沒(méi)有大模型的理科分?jǐn)?shù)達(dá)到河南省一本線(xiàn)。

有道相關(guān)負(fù)責(zé)人對(duì)記者表示,今年以來(lái)AI進(jìn)展迅速,尤其是DeepSeek-R1帶來(lái)了推理模型大爆發(fā),而大模型推理能力和交互能力在教育場(chǎng)景的適配性非常高,能夠逐步解決個(gè)性化教學(xué)和答疑的需求,而且提供的指導(dǎo)和答疑質(zhì)量越來(lái)越高,所以選擇與高考頂尖學(xué)霸進(jìn)行同題測(cè)試,用一種直接明了的方式向大眾展示AI大模型能力的提升。

在題型選擇上,主要基于難度和認(rèn)知度的考量,上述負(fù)責(zé)人表示,“因?yàn)榇蠹覍?duì)高考的難度都是有概念的,尤其是這種高難度的理科壓軸題,容易引起關(guān)注,也能直觀展示效果。”

上述人士透露,前段時(shí)間還做了北京最新高考二模(題庫(kù)數(shù)據(jù)里沒(méi)有的新題)的挑戰(zhàn)。AI答題后由老師進(jìn)行批改,分?jǐn)?shù)為697分(總分750分),達(dá)到“清北”水平。“畢竟去年AI集體做24年高考題的時(shí)候理科幾乎全軍覆滅。”

過(guò)去一年時(shí)間,不少大模型公司將數(shù)學(xué)能力作為大模型的能力體現(xiàn)。OpenAI在介紹OpenAI o3-mini時(shí)表示,OpenAI o3?mini 的高推理能力在 FrontierMath 上的表現(xiàn)優(yōu)于其前輩。在 FrontierMath 上,當(dāng)被要求使用 Python 工具時(shí),具有高推理能力的 o3?mini 首次嘗試即可解決超過(guò) 32% 的問(wèn)題,其中包括超過(guò) 28% 的挑戰(zhàn)性 (T3) 問(wèn)題。FrontierMath是由Epoch AI聯(lián)合60余位全世界的數(shù)學(xué)家共同推出了全新的數(shù)學(xué)基準(zhǔn),其原創(chuàng)的數(shù)學(xué)問(wèn)題對(duì)于專(zhuān)業(yè)數(shù)學(xué)家而言仍需數(shù)小時(shí)甚至數(shù)日解決。不過(guò),OpenAI公布的成績(jī)后續(xù)曾遭到質(zhì)疑。

此前谷歌宣布推出了基于強(qiáng)化學(xué)習(xí)的數(shù)學(xué)推理系統(tǒng) AlphaProof,以及幾何求解系統(tǒng)的改進(jìn)版 AlphaGeometry 2。谷歌表示這兩款系統(tǒng)共同解決了2024年國(guó)際數(shù)學(xué)奧林匹克(IMO) 六道題目中的四道,首次達(dá)到了與銀牌得主相當(dāng)?shù)乃健?/p>

今年4月29日,阿里巴巴發(fā)布新一代通義千問(wèn)模型Qwen3。據(jù)了解,在奧數(shù)水平的AIME25測(cè)評(píng)中,千問(wèn)3斬獲81.5分,刷新開(kāi)源紀(jì)錄。

艾媒咨詢(xún)發(fā)布的《2024年人工智能+教育行業(yè)發(fā)展研究報(bào)告》指出,2023至2027年在線(xiàn)教育市場(chǎng)的AI貢獻(xiàn)率預(yù)計(jì)從7%提升至16%左右。

標(biāo)簽:

搶先讀

相關(guān)文章

熱文推薦

精彩放送

關(guān)于我們| 聯(lián)系我們| 投稿合作| 法律聲明| 廣告投放

版權(quán)所有© 2011-2023  產(chǎn)業(yè)研究網(wǎng)  m.www-332159.com

所載文章、數(shù)據(jù)僅供參考.本站不作任何非法律允許范圍內(nèi)服務(wù)!

聯(lián)系我們:39 60 29 14 2 @qq.com

皖I(lǐng)CP備2022009963號(hào)-13


娄底市| 霍邱县| 武川县| 宝丰县| 长沙县| 乡城县| 额济纳旗| 城口县| 阜新| 甘南县| 平顺县| 榆林市| 永福县| 广西| 宁城县| 扎鲁特旗| 山西省| 洮南市| 通道| 德州市| 曲周县| 武城县| 若羌县| 神农架林区| 陕西省| 蛟河市| 金平| 石阡县| 陆丰市| 平南县| 河津市| 喀喇沁旗| 和平区| 璧山县| 礼泉县| 柞水县| 琼结县| 丰顺县| 宁晋县| 博乐市| 遵义市|