亚洲精品无码乱码成人|最近中文字幕免费大全|日韩欧美卡一卡二卡新区|熟妇性饥渴一区二区三区|久久久久无码精品国产AV|欧美日韩国产va在线观看|久久精品一本到99热动态图|99国产精品欧美一区二区三区

您現在的位置是: 股票 > > 正文

2023年最強悍的國產大模型,這幾家排名前四 世界快報

時間:2024-01-15 18:04:32 來源:今日熱點網 發(fā)布者:DN032

ChatGPT火爆出圈帶火了通用人工智能大模型,據不完全統計,截至2023年8月,僅國內發(fā)布的大模型就多達156個,在這些大模型中,表現優(yōu)異者有,濫竽充數者也有。

就去年8月份新華社研究院中國企業(yè)發(fā)展研究中心發(fā)布的《人工智能大模型體驗報告2.0》、《麻省理工科技評論》發(fā)布的大模型評測報告、12月新華社研究院中國企業(yè)發(fā)展研究中心發(fā)布的《人工智能大模型體驗報告3.0》等來看,在當前的國內各主流大模型,綜合能排名前四的分別有以下幾個:

《人工智能大模型體驗報告2.0》評測結果

《麻省理工科技評論》評測結果

《人工智能大模型體驗報告3.0》評測結果

1.科大訊飛星火認知大模型

在《人工智能大模型體驗報告2.0》中,以1013的綜合能得分排名第一;

在《麻省理工科技評論》的大模型評測報告中,以81.5的得分榮獲中國“最聰明”大模型稱號;

在《人工智能大模型體驗報告3.0》中,以1775的高分蟬聯冠軍,并獲得基礎能力指數、智商指數、工具提效指數三項評測指標第一。

科大訊飛星火大模型發(fā)布于2023年5月6日,具備文本生成、語言理解、知識問答、邏輯推理、數學、代碼、多模態(tài)等七大核心能力。其后,星火大模型多次升級迭代,目前最新版本為3.0。

10月份,為深入了解相關大模型的實際應用情況,國務院發(fā)展研究中心國研經濟研究院開展了一項大模型行業(yè)應用能力測評研究,旨在評估大模型不同行業(yè)下的表現情況,分析潛在的應用場景和模式,對比我國大模型與國際一流大模型的行業(yè)表現,并在此基礎上提出我國大模型產業(yè)高水發(fā)展的政策建議。

選取的大模型包括:星火大模型3.0版、ChatGPT、GPT-4和國內某大模型。

測評行業(yè)方面選擇了知識密集型的生產服務業(yè)(法律服務與工業(yè)設計)、個化需求高的生活服務業(yè)(醫(yī)療、教育與零售)以及部分制造業(yè)(汽車工程、計算機),并基于臨床執(zhí)業(yè)醫(yī)師資格考試、中醫(yī)執(zhí)業(yè)醫(yī)師資格考試、國家統一法律職業(yè)資格考試、機動車檢測維修專業(yè)技術人員執(zhí)業(yè)資格、全國計算機技術與軟件專業(yè)技術資格等權威職業(yè)資格考試構建了測評題目,以評估大模型在行業(yè)知識、技能掌握水、生產經營場景理解能力等維度的表現。

評測結果顯示,星火大模型的綜合能力達到國際一流水,所有7個測評行業(yè)中表現均大幅超越ChatGPT,并在部分行業(yè)優(yōu)于GPT-4,在與國內某大模型的比較中也表現優(yōu)異。

特別是在醫(yī)療、法律、教育行業(yè),訊飛星火大模型表現格外突出,中文領域知識和語言理解能力已分別超越GPT4表現5.3%和4.1%,在教育領域基礎能力的表現與GPT4的表現差距小于1%。

2.百度文心一言

在《人工智能大模型體驗報告2.0》和《麻省理工科技評論》發(fā)布的大模型評測報告中,百度文心一言分別以1010、72.5的得分位列第二,能表現僅次于訊飛星火大模型。

據了解,百度文心一言發(fā)布于3月16日,主要能力包括文學創(chuàng)作、商業(yè)文案創(chuàng)作、數理邏輯推算、中文理解和多模態(tài)生成。

百度創(chuàng)始人、董事長兼 CEO李彥宏在發(fā)布會上表示,雖然文心一言在內測中并不完美,但是市場有需求必須推出來。

文心一言的技術原理是基于自然語言處理技術和深度學技術。它通過建立海量的語料庫和深度學算法,學文章的句式、語言慣、修辭手法、篇章結構、時態(tài)語態(tài)等方面的知識,從而可以根據用戶輸入的關鍵詞和需求,自動生成符合語法和語義的文章段落和句子。

可實現的功能與科大訊飛星火、商湯商量等通用大模型類似。不僅能和用戶聊天,還可以快速生成處理各種各樣的文本內容,如文章、詩歌、歌詞、代碼、圖片等。

2023 年10 月 17 日,文心一言升級到4.0版本,理解、生成、邏輯、記憶四大能力得到提升。

3.商湯商量

在《人工智能大模型體驗報告2.0》中和智譜AI-ChatGLM并列第三,綜合得分983分,在《麻省理工科技評論》發(fā)布的大模型評測報告中排名第三,得分68.3。在《人工智能大模型體驗報告3.0》中得分1746,排名第二,并在定量實測的情商維度上,位居全部10款大模型第一,與在定評估中,與訊飛星火大模型、智譜AI-ChatGLM一起選大模型市場未來領袖象限。

“商量”的寓意是“商量商量,都能解決”。

“商量”一名,實際上點出了ChatGPT類模型的核心,即用戶在多輪對話中,通過“魔法”調教,挖掘大模型解決問題的能力。

據悉,商湯商量于今年4月正式推出,是國內最早推出的基于千億參數大語言模型的產品之一,并一直不斷迭代更新。

圍繞大模型及研發(fā)體系商湯以SenseCore商湯AI大裝置為基礎,建立了一套工程化的體系來支撐大模型的快速迭代,軟件、系統和硬件都在以服務大模型快速迭代為目標做研發(fā)配合,實現了敏捷、低成本、大批次地做模型迭代,有助于商湯發(fā)現大模型最好、最有效的生產配方。

4.智譜AI-ChatGLM

在《人工智能大模型體驗報告2.0》中和商湯商量并列第三,綜合得分983分,在《人工智能大模型體驗報告3.0》中得分1729,排名第三,在定評估中,與訊飛星火大模型、智譜AI-ChatGLM一起入選大模型市場未來領袖象限。

ChatGLM 是由清華大學創(chuàng)新領軍工程博士張鵬帶領下的團隊開發(fā)的一個開源且支持中英雙語的類 ChatGPT 大語言模型,發(fā)布于3月18日。

10月27日,智譜AI在2023中國計算機大會(CNCC)上推出了全新的ChatGLM3大模型,這款最新的模型采用了創(chuàng)新的多階段增強預訓練方法,以實現更加充分的訓練效果

智譜AI的首席執(zhí)行官張鵬親自進行了新品發(fā)布,并通過實時演示展示了產品的最新功能。據介紹,通過使用更豐富的訓練數據和優(yōu)化的訓練方案,ChatGLM3的能得到了顯著提升。與之前的ChatGLM2相比,MMLU提升了36%,CEval提升了33%,GSM8K提升了179%,BBH提升了126%。

此外,ChatGLM3還進行了針對GPT-4V的迭代升級,引入了一些全新的功能。其中包括具備多模態(tài)理解能力的CogVLM-看圖識語義,在10余個國際標準圖文評測數據集上取得了領先水;代碼增強模塊Code Interpreter能夠根據用戶需求生成并執(zhí)行代碼,自動完成數據分析、文件處理等復雜任務;網絡搜索增強模塊WebGLM-接入搜索增強,能夠自動查找互聯網上與問題相關的資料,并在回答時提供參考的相關文獻或文章鏈接。

小結:

盡管2023年,國內大模型發(fā)展突飛猛進,涌現出不少標桿產品,在行業(yè)應用方面表現優(yōu)異,但我們也必須看到,人工智能技術的發(fā)展是一個持續(xù)的過程,需要不斷地進行技術研發(fā)和創(chuàng)新。

探索賦能不同行業(yè)場景的落地方式將成為我國大模型企業(yè)快速發(fā)展的重要方向,而行業(yè)應用價值也將成為評判大模型的核心指標。唯有出現成千上萬個解決生產、生活真實需求的AI原生應用,大模型才能真正深入社會經濟的各個角落,助力各行各業(yè)的產業(yè)升級,推動中國經濟的快速復蘇,深刻改變人們的生活方式。

據公開數據,全球范圍內人工智能將持續(xù)高速增長,市場規(guī)模持續(xù)擴大,預計到2032年,全球人工智能市場規(guī)模將達到1.3萬億美元。

在充滿活力和機遇的時代背景下,人工智能大模型的興起將持續(xù)引領科技進步,無論是在技術創(chuàng)新、商業(yè)應用還是在產業(yè)變革的推動方面,大模型都將發(fā)揮重要作用。伴隨著應用領域的不斷擴展,為各產業(yè)發(fā)展帶來新的可能。

免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。

標簽:

搶先讀

相關文章

熱文推薦

精彩放送

關于我們| 聯系我們| 投稿合作| 法律聲明| 廣告投放

版權所有© 2011-2023  產業(yè)研究網  m.www-332159.com

所載文章、數據僅供參考.本站不作任何非法律允許范圍內服務!

聯系我們:39 60 29 14 2 @qq.com

皖ICP備2022009963號-13


惠东县| 邻水| 海南省| 左云县| 霸州市| 安达市| 乡宁县| 修水县| 镶黄旗| 秀山| 夏津县| 枣强县| 上犹县| 墨竹工卡县| 鱼台县| 陇南市| 沙河市| 穆棱市| 陆川县| 龙门县| 长治县| 翁源县| 团风县| 舒兰市| 万州区| 满城县| 汪清县| 随州市| 将乐县| 咸丰县| 本溪市| 长子县| 邵武市| 安国市| 青阳县| 永州市| 南华县| 彰化市| 新竹市| 邹平县| 清河县|