每日時訊!國內(nèi)最小的大模型創(chuàng)業(yè)團(tuán)隊,靠另類創(chuàng)新出位
擁有多年NLP經(jīng)驗的虎博科技,憑借自身獨特的技術(shù)創(chuàng)新,打破“成本魔咒”,重新定義“短小精悍”。
國內(nèi)大模型創(chuàng)業(yè)迎來了新面孔。
包含70億參數(shù)和1800億參數(shù)兩個版本的大模型TigerBot正式亮相,一經(jīng)推出,就以獨特的實力,引起了外界矚目。
【資料圖】
從評測結(jié)果可見,TigerBot與OpenAI同規(guī)模模型的得分十分接近
作為一款國產(chǎn)自研的多模態(tài)大語言模型,TigerBot不僅能進(jìn)行編程、畫圖、翻譯,還支持多種辦公場景下的任務(wù),具有高效的學(xué)習(xí)能力、創(chuàng)造力和可控性。
更重要的是,借助更先進(jìn)的微調(diào)算法,TigerBot在只使用少量參數(shù)的情況下,就能快速理解人類的問題,提升回答的準(zhǔn)確性。
在同樣50萬條數(shù)據(jù)訓(xùn)練的情況下,TigerBot的收斂速度比斯坦福推出的Alpaca快5倍,在公開數(shù)據(jù)集上評測顯示性能提升17%。
有點難以置信的是,研發(fā)了如此強勁大模型的團(tuán)隊,最初只有5個人,身為CEO兼首席科學(xué)家的團(tuán)隊Leader陳燁,擔(dān)任了最核心的代碼工作。
后來成員規(guī)模雖有擴充,但也只控制在了10人左右。
那么,這個在激烈的大模型競爭中,TigerBot背后的中國企業(yè)——虎博科技,究竟是怎樣憑借犀利小團(tuán)隊殺出一條血路的呢?
01 重新定義“精悍”
眾所周知,訓(xùn)練大模型所需的高昂算力、成本,一度使得ChatGPT這樣的通用大模型,成為了少數(shù)科技巨頭的專利。
然而,擁有多年NLP經(jīng)驗的虎博科技,卻憑借自身獨特的技術(shù)創(chuàng)新,打破了這一“成本魔咒”,并重新定義了何謂“短小精悍”。
具體來說,為了降低模型的訓(xùn)練成本和難度,虎博科技在以下幾個方面進(jìn)行了創(chuàng)新:
指令完成監(jiān)督微調(diào)
所謂指令完成監(jiān)督微調(diào),主要就是讓模型更加理解人類提出的各種問題。
如果模型像一個學(xué)生,那么問題就像一個作業(yè)。
如果老師只是給學(xué)生一個作業(yè),不告訴他這個作業(yè)要考察什么知識點,要用什么方法來解答,那么學(xué)生可能會很困惑,于是有些問題的回答質(zhì)量往往就不佳。
面對這樣的問題,以往人們想到的辦法,是通過微調(diào)和提示的方式,來讓模型變得“更通人性”。
具體來說,微調(diào)是在大量的任務(wù)相關(guān)的數(shù)據(jù)上,重新訓(xùn)練模型的參數(shù),這就像給了學(xué)生一本厚厚的輔導(dǎo)書,雖然可以讓他學(xué)得更好,但也會花費很多時間和精力。
而提示則是在每個問題前加上一些特殊的單詞或符號,就像給學(xué)生一個小抄,讓小抄引導(dǎo)他寫出正確答案,但這一方法也需要老師花心思制作小抄,而且小抄的內(nèi)容也會限制學(xué)生的應(yīng)變能力。
對此,TigerBot的應(yīng)對之策,是使用一種標(biāo)記語言(Mark-up Language),在每個問題前加上一些特殊的符號。
這相當(dāng)于給每個作業(yè)打上了“標(biāo)簽”。
如此一來,學(xué)生就能明白,這個作業(yè)是數(shù)學(xué)題,要用加減乘除來解答;那個作業(yè)是英語題,要用翻譯來解答;從而讓模型快速地理解了各種問題。
但別看只是個“打標(biāo)簽”的小小改動,真正要踐行這樣的技術(shù)創(chuàng)新,卻絕非易事。
因為標(biāo)記語言并不是一種簡單的任務(wù)標(biāo)簽,它需要有一定的語法規(guī)則和語義表達(dá)能力,才能讓 LLMs(大模型) 準(zhǔn)確地理解和執(zhí)行指令。
其次,標(biāo)記語言并不是一種獨立的技術(shù),要讓 LLMs 能夠有效地利用標(biāo)記語言來完成各種任務(wù),還需要借助預(yù)訓(xùn)練、微調(diào)、元學(xué)習(xí)等其他多種技術(shù)。
因此,整合各種技術(shù)并設(shè)計一種通用且易用的標(biāo)記語言,是一項具十分前沿的創(chuàng)新性工作,涉及多個方面的挑戰(zhàn)和難點。
唯有那些具備深厚理論基礎(chǔ)和實踐經(jīng)驗的團(tuán)隊,才能做出這類突破。
突破并行訓(xùn)練難關(guān)
除了模型的底層架構(gòu)上的改進(jìn)外,TigerBot另一大降低訓(xùn)練難度和成本的創(chuàng)新,就是突破了deep-speed等主流框架中的若干內(nèi)存和通信問題,實現(xiàn)了千卡環(huán)境下訓(xùn)練數(shù)月無間斷。
在此之前,要想千卡環(huán)境下進(jìn)行數(shù)月無間斷的訓(xùn)練,會面臨很大的技術(shù)難點。
這里可以用一個形象的比喻說明:
想象一下,在一個擁擠的馬路上,用很多輛小車來運送一座大山,要花費多大的時間和精力?要面對怎樣的擁堵和阻礙?
在這里,“小車”就象征著每個 GPU 的內(nèi)存空間,“大山”象征著模型的參數(shù)和梯度。
雖然我們有一千輛小車可以用,但是每輛小車的載重能力都很有限,遠(yuǎn)遠(yuǎn)不夠裝下整座大山。
另一方面,模型的參數(shù)和梯度需要在多個 GPU 之間頻繁地交換和更新,需要消耗很多的通信資源。
這就像是要把一座大山從一個地方運到另一個地方,需要經(jīng)過很多次的裝卸和轉(zhuǎn)運,不僅會耽誤時間,還會消耗大量的資源。
對此,TigerBot主要使用了三個技術(shù),來進(jìn)行并行訓(xùn)練的優(yōu)化。
首先,TigerBot 使用了一種叫做ZeRO的技術(shù),它可以把模型的參數(shù)和梯度分散到多個 GPU 上,從而減少每個 GPU 的內(nèi)存占用。
這就像是把大山分成很多小塊,然后用不同的小車來運送一部分小塊。這樣,每輛小車就不會超載了,而且可以同時出發(fā),提高訓(xùn)練的效率。
其次,TigerBot 使用了一種叫做DeepSpeed的技術(shù),它可以根據(jù)模型的參數(shù)和梯度的大小和分布,自動地選擇最合適的通信方式和路徑。
這就像是一個智能導(dǎo)航系統(tǒng),它可以根據(jù)貨物的重量和目的地,自動地選擇最快的交通工具和路線,從而大大節(jié)約了時間和資源。
再次,TigerBot 使用了一種叫做BF16的技術(shù),它可以降低模型的精度要求,從而減少計算的復(fù)雜度和內(nèi)存的需求。
這就像是將同等大小的山體碎塊換成了塑料或紙板,從而大大從降低運輸?shù)呢?fù)擔(dān)。
借由著這些技術(shù),虎博科技每月在訓(xùn)練上的開銷,能夠節(jié)省數(shù)十萬。
這也是為什么,他們能以10人左右小團(tuán)隊,在幾個月時間內(nèi)實現(xiàn)“媲美”O(jiān)penAI壯舉的原因之一。
02 正向突變
除了上述提到的技術(shù)外,虎博科技在大模型方面,還運用ensemble和probabilistic modeling的方法,讓模型在創(chuàng)造性和可控性上做出了適當(dāng)?shù)臋?quán)衡。
同時,針對中文連續(xù)性強、多義歧義情況多等問題,虎博科技通過不斷吸取開源模型和代碼中的優(yōu)點,從tokenizer到訓(xùn)練算法上,都做了相應(yīng)優(yōu)化。
而這些提升性能、降低成本的技術(shù)創(chuàng)新,和自然界中的生物面臨環(huán)境壓力時,所激發(fā)出的“突變”和“進(jìn)化”,有著異曲同工之妙。
面對訓(xùn)練大模型所需的巨量算力、數(shù)據(jù)時,實力并不強勁的中小企業(yè),也感到了某種“演化壓力”。
為了在這場AI競賽中不被時代拋棄,部分中小企業(yè),只能被倒逼著選擇了一種更能降本增效的技術(shù)策略。
然而,這樣的“壓力”,卻并不總是能激發(fā)正向的“突變”與“進(jìn)化”,部分實力羸弱的企業(yè),可能直接倒在了這場殘酷的大模型競爭中,還有的企業(yè)干脆選擇了投機取巧,以炒作和公關(guān)來吸引融資。
既然如此,那虎博科技是如何在這樣的壓力下,完成正向“突變”的呢?
談到這個問題,我們就不得不提起虎博科技的創(chuàng)始人兼CEO——陳燁。
某種程度上,與OpenAI的Sam Altman一樣,陳燁也是一個心懷科技理想的天才創(chuàng)業(yè)者。
在AI領(lǐng)域的造詣上,陳燁不僅三次獲得人工智能頂級會議(KDD和SIGIR)最佳論文獎,在人工智能和機器學(xué)習(xí)領(lǐng)域發(fā)表了20余篇具有業(yè)界影響的論文,并擁有10余項專利。
并且還曾在美國的微軟、eBay和Yahoo擔(dān)任主任科學(xué)家和研發(fā)總監(jiān)等職位,成功實施過多個深具業(yè)界影響力的人工智能系統(tǒng)。
而每一個對AI技術(shù)進(jìn)行過深度研究的人,都明白這項技術(shù)的遠(yuǎn)大意義。
這樣的人,如果想在AI領(lǐng)域干一番事業(yè),就絕不會僅僅只是為了賺錢。
在2017年,陳燁成立了虎博科技,開始專注于NLP技術(shù)的應(yīng)用落地,愿景是用AI賦能下一代搜索引擎,連接人與全球信息,讓人們獲取知識更簡單。
然而,再遠(yuǎn)大的理想,也要有現(xiàn)實的支撐。
深諳AI技術(shù)發(fā)展路徑的陳燁明白,人工智能的進(jìn)步與迭代,需要漫長的研發(fā)周期,雖然短期來看,資本市場對這類技術(shù)有著很大熱情,也產(chǎn)生了很多泡沫,但如果長時間未能看見實際的應(yīng)用或產(chǎn)出,各路資本就都會紛紛人走茶涼。
面對這個問題,理性而成熟的陳燁,選擇了一條更為穩(wěn)健的道路,來堅守自己的理想。
在彼時的國內(nèi)AI賽道上,智能金融成為了陳燁首先瞄準(zhǔn)的目標(biāo)。
這是因為,金融行業(yè)的運轉(zhuǎn),往往伴隨著巨大的數(shù)據(jù)量,且與教育、醫(yī)療等行業(yè)相比,金融領(lǐng)域的很多數(shù)據(jù)都是公開、且易于獲取的。
于是,結(jié)合自身的NLP技術(shù),虎博科技研發(fā)的新一代智能金融信息搜索引擎——虎博搜索誕生了。
虎博搜索的數(shù)據(jù)覆蓋 了A 股、港股及美股,包括行情、公告、研報、新聞等多維度信息。
利用語義挖掘、知識圖譜、機器翻譯等核心技術(shù),虎博搜索不僅實現(xiàn)了口語化交流問答,并且還通過精確的數(shù)據(jù)抽取,以及跨越語言的功能,從海量信息中挖掘到深層次信息,并提供了本地編輯、報告全文、溯源定位等多種功能。
而這些功能背后的深度學(xué)習(xí)、知識圖譜、文本生成等技術(shù),都是未來大模型所必將涉及的關(guān)鍵點。
在此后的發(fā)展歷程中,虎博科技又自主研發(fā)了各大金融領(lǐng)域的關(guān)鍵技術(shù),包括智能推薦、翻譯、輿情分析等,而由此積累的NLP經(jīng)驗,也為后來的TigerBot的誕生夯實了工程基礎(chǔ)。
03 總結(jié)
縱觀TigerBot誕生的過程,我們可以發(fā)現(xiàn),這是一個既守住了飯碗,又贏得了理想的故事。
科研出身的陳燁,有技術(shù),也有情懷,但卻并沒有在現(xiàn)實與理想之間顧此失彼,而是以用戶需求為導(dǎo)向,結(jié)合自身的技術(shù)優(yōu)勢,開發(fā)出多種適用于不同場景的AI產(chǎn)品。
在此過程中,其依據(jù)對技術(shù)前沿趨勢的敏銳洞察,逐步提高了自身的開發(fā)能力和工程化水平,從而在后來的大模型研發(fā)中,突破了主流框架中的技術(shù)難點和瓶頸。
如果說,當(dāng)下的大模型競爭,是一場物競天擇的競賽,那么唯有那些在廣泛的產(chǎn)品和服務(wù)中,積累了足夠多技術(shù)因子的企業(yè),才能在壓力和挑戰(zhàn)面前,完成“進(jìn)化”與“突變”。
標(biāo)簽:
搶先讀
- 蘇寧易購發(fā)布618下沉市場消費大數(shù)據(jù):鄭州鄭庵鎮(zhèn)成為最強消費小鎮(zhèn) 最新快訊
- 實時焦點:財政部:前5月證券交易印花稅收入891億元,同比降36.9%
- 數(shù)據(jù)要素,誰是成長最快企業(yè)? 世界今日訊
- 環(huán)球觀熱點:2023福建南平市考試錄用公務(wù)員擬錄用人員名單公示(七)
- 小學(xué)入學(xué)政策有新變化,6周歲將不再是入學(xué)門檻?家長喜憂參半
- 港股醫(yī)藥板塊持續(xù)走高 信達(dá)生物漲超8%
- 中鋼洛耐最新公告:本次詢價轉(zhuǎn)讓價格為5.3元/股-每日短訊
- 【熱聞】市場監(jiān)管總局:鼓勵支持相關(guān)經(jīng)營主體重塑信用
- 昇思開源社區(qū)理事會成立 基于昇思AI框架的全模態(tài)大模型“紫東.太初2.0”發(fā)布
- 江門市2023年度高級經(jīng)濟師考試溫馨提示-全球快資訊
- 跨越伶仃洋 一橋連三地:這座世界最長跨海大橋為大灣區(qū)帶來新機遇
- 環(huán)球簡訊:安潔科技:擬對適新國際增資1000萬美元,用于投設(shè)越南子公司
- 今日熱訊:安陽紅旗渠機場試飛成功
- 上市券商2022年業(yè)績普降ROE明顯回落 天天熱訊
- 中國汽車崛起,合資品牌得像牲口一樣活下去|快消息
- 當(dāng)前訊息:售23.18萬 魏牌新摩卡DHT-PHEV亮相粵港澳車展
- 熱頭條丨TES六連勝阿水讓人陌生,Rookie透露沒睡夠,Doinb直言LGD不配贏
- 全球快看點丨《AC幻景》地圖大小等于《大革命》 將不會過于臃腫
- 東吳證券:餐飲等服務(wù)消費繼續(xù)恢復(fù) 可選品有所回暖_全球快訊
- 【焦點熱聞】青春喜劇電影《表白吧!在畢業(yè)前》今日公映
- 資訊推薦:驚艷的女孩名字 賈姓聽過最驚艷的女孩名字
- 財面兒丨金科地產(chǎn)集團(tuán):“21金科地產(chǎn)SCP004”未按期償付本息 涉及金額8.8億元
- 環(huán)球關(guān)注:蘋果手機多個偷拍軟件上熱搜:到底是誰在用?
- 科倫博泰IPO:劉革新帶兒子進(jìn)董事會,兩年半估值暴漲31倍_環(huán)球觀點
- 快船球隊管理層忙布局!打感情牌,想威少380萬美元續(xù)約 全球簡訊
- vivo S17 手機開售:優(yōu)惠 30 元,到手 2469 元起 |天天快資訊
- 845.63億元!第三十二屆哈洽會已簽約貿(mào)易投資項目224個
- 微信:集中整治涉企業(yè)、企業(yè)家的虛假不實和侵權(quán)信息 嚴(yán)厲打擊惡意炒作行為_天天速看
- 環(huán)球關(guān)注:加強企業(yè)安全意識 提升全民安全素質(zhì)
- 大眾汽車召回部分進(jìn)口賓利飛馳系列汽車,共計3028輛 天天頭條
- 當(dāng)前視訊!再看《三峽好人》 | 停云
- 河南:強化監(jiān)督執(zhí)紀(jì) 筑牢南水北調(diào)工程安全“堤壩”
- 浙江醫(yī)藥: 目前公司并無以新冠肺炎為適應(yīng)癥的醫(yī)藥制劑產(chǎn)品_聚焦
- 6月16日十大人氣股:?;厮贇w(名單)
- 打狗棍特別節(jié)目(廣東珠江臺 打狗棍) 環(huán)球速看
- 《蜘蛛俠2》全新可探索區(qū)域:知名休閑區(qū)康尼島
- 當(dāng)前頭條:北京三宗地出讓攬金149.82億元 亦莊新城熱門地塊被“生面孔”中皋置業(yè)搖中
- 時訊:高質(zhì)量發(fā)展調(diào)研行丨哈密金風(fēng)裝備制造風(fēng)速發(fā)展
- 工傷申報找哪個部門|環(huán)球時訊
- 全球新動態(tài):中南新能源合作幫南非解“電荒”
- 網(wǎng)商貸還不上會怎么樣?還不上多久被催收? 全球看熱訊
- 人民幣對美元中間價上調(diào)200個基點,全年人民幣匯率最高或升至6.6
- 進(jìn)入女性體內(nèi)后 沒“受精”成功精子的命運 既好笑又心疼
- 每日熱門:騰訊智慧交通副總裁施雪松:相比技術(shù),智慧交通的決策和管理才是真正挑戰(zhàn)
- 每日短訊:知名演員現(xiàn)身醫(yī)院眼眶濕潤!妻子患病緊急做手術(shù),躺病床臉色蒼白
- 真正高配的人生,其實就是不斷做減法
- 民航局:5月國內(nèi)客運規(guī)模比2019年同期增長2.6% 聚焦
- 可斷匈奴右臂的烏孫,為何不愿與漢朝共擊匈奴? 天天視訊
- 環(huán)球熱門:6月16日上期所滬銅期貨持倉比例
- 加快建設(shè)國家級石墨資源開發(fā)利用研發(fā)平臺 當(dāng)前短訊
- 世界最新:財政部:前5月 全國一般公共預(yù)算支出超10萬億元
- 2023石家莊端午節(jié)親子游好去處
- 6月16日國內(nèi)鏑鋱系部分價格下滑 環(huán)球頭條
- 小米“小愛建議”已支持MIUI14:覆蓋40余款機型
- 今日起 重慶往返香港航班正式恢復(fù)-全球焦點
- 播報:2023年5月全球非洲豬瘟疫情匯總:共500多起,波蘭發(fā)生疫情次數(shù)最多
- 香港一季度末市面流通信用卡總數(shù)1970萬張 同比上升2.8%
- 無情的世界無情的你是什么歌_無情的世界無情的你歌曲
- 皇氏乳業(yè)榮登“中國500最具價值品牌榜單”
- 天天速訊:中國工商銀行與陜西省人民政府簽署戰(zhàn)略合作協(xié)議
- 南華瑞富一年定開債基成立 每日速讀
- 反向裁切照片你試過沒?這個 AI 制圖工具好玩又實用_最新資訊
- 誰“偷”了我的信息:一杯網(wǎng)紅奶茶產(chǎn)生87條數(shù)據(jù)背后|環(huán)球快資訊
- 當(dāng)前速讀:中雨!大雨!暴雨在路上!陜西發(fā)布最新預(yù)警,今晚……
- 惜敗歐洲第一!EDG1:2TL進(jìn)入敗者組! 要聞速遞
- 杭州亞運村內(nèi)部功能區(qū)首次公開亮相 一起全景感受無限好“村”光|天天即時看
- 三晉夏收農(nóng)忙“豐”景
- 實時:攻擊性還是那么強!EDG分享對陣LNG海報:還是廢紙一張!
- 全球快看點丨蘇翊鳴保送推薦清華大學(xué)
- 官媒:樓市下跌比預(yù)想加大,專家:7月或出臺更大樓市刺激政策
- 6月16日國內(nèi)丁苯橡膠市場行情小幅波動 全球微動態(tài)
- 如何寫好合同中的違約責(zé)任 天天觀熱點|天天快看點
- 【環(huán)球時快訊】華如科技(301302):該股換手率大于8%(06-16)
- 采用全新設(shè)計風(fēng)格 新款別克昂科威Avenir官圖發(fā)布
- 香港一季度末市面流通信用卡總數(shù)1970萬張 同比上升2.8%
- 快資訊:初三老師對學(xué)生的鼓勵寄語有哪些
- 每日頭條!汪蘇瀧巡回演唱會首場北京站加場
- 全球熱議:南縣麻河口鎮(zhèn):禁毒宣講進(jìn)校園 守護(hù)青春助成長
- 天天速訊:配置更高價格更香 海豹冠軍版靜態(tài)體驗
- 每日聚焦:5月主要能源產(chǎn)品生產(chǎn)均保持同比增長
- 余承東:比亞迪是少數(shù)能活下來的巨頭之一 小公司造不了車
- 熱點!亮點劇透!帶你了解世界互聯(lián)網(wǎng)大會數(shù)字文明尼山對話精彩活動
- 合盛硅業(yè): 朋友公司目前尚無有機硅期貨業(yè)務(wù),僅有工業(yè)硅期貨業(yè)務(wù)-世界聚焦
- 天天熱文:液冷概念股震蕩走高
- 新時代能源(00166)6月16日斥資12.45萬港元回購100萬股
- 簡訊:南陽一AA級國資控股集團(tuán)完成發(fā)行5億元私募債 利率5.48%
- 再添重器!我國首艘,成功交付!
- 華夏中證港股通50ETF聯(lián)接基金順勢發(fā)行
- 降息是股債雙牛的起點;市場底早于經(jīng)濟底;降息后續(xù)還需要政策配合|大V熱觀點
- 【全球速看料】為何人類不能永生 生物學(xué)家 人類只是基因手下的“打工仔”而已
- 金牌廚柜:擬約8億元投建定制家居項目-天天通訊
- 暑期防溺水 安全記心間|今日精選
- 如何找到一份系統(tǒng)工程師的工作?
- 國家發(fā)改委最新回應(yīng)!
- 北上資金今日凈買入105.46億元-每日視點
- 市區(qū)聯(lián)合行動,保障大鵬新區(qū)勞動者職業(yè)健康-每日視點
- 才藝展演、“篝火”晚會……華山幼兒園舉辦畢業(yè)典禮
- 【世界快播報】成都大運會門票已正式開售(附購票入口+規(guī)則)
- 租戶裝修門面房,打通多間墻體,挖機開進(jìn)房間!江蘇一小區(qū)業(yè)主:地梁鋼筋都漏出來了,還有人家里瓷磚被震掉
- 2023年最新江蘇防溫降暑費標(biāo)準(zhǔn)來了 江蘇高溫費發(fā)放標(biāo)準(zhǔn)2022幾個月?