ChatGPT PK國產大模型:差距與中國路徑。

不同於美國ChatGPT在多模態大型語言《NLP》模型方面的領先水平,目前國內AI大模型的研發方向聚焦在『解決產業技術壁壘問題』。

ChatGPT4這 種酷似『人類』的聊天機器人的誕生,讓業界驚嘆之餘,也引發了人們的擔憂,以致於以馬斯克為代表的上千名美國科技人士聯合簽名『暫停半年期研發』。

ChatGPT4的誕生,猶如潘多拉魔盒,可能會讓人類走向不可預知的技術深淵。

不同於美國ChatGPT4在多模態大型語言《NLP》模型方面的領先水平,中國人工智能《AI》的類ChatGPT平臺,如華為盤古大模型4、阿裡通義千問、百度文心一言等,目前更傾向於把研發方向聚焦在『解決產業技術壁壘問題』。

而且來自知危編輯部的最新測試也顯示,在解讀中文語義方面,國內AI大模型不比ChatGPT遜色,比如阿裡通義千問甚至略勝一籌。

國產AI大模型與ChatGPT4的差距在哪裡? 目前發展如何?

解讀中文語義的差別有多大

緊隨ChatGPT的發佈,今年3月,百度率先發佈文心一言大語言模型。

現場演示效果不盡人意,卻讓大家看到了國內外自然語言處理《NLP》大模型方面的差距,以及百度搶占大模型市場的心態。

4月6日,華為雲宣佈『即將上線』盤古大模型4系列,包括NLP《自然語言處理》大模型、CV《計算機視覺》大模型、多模態大模型、科學計算大模型等多個大模型。

即將發佈的盤古『NLP大模型』是被認為最接近人類中文理解能力的AI大模型。

4月7日,阿裡雲自研大模型『通義千問』開始邀請用戶測試體驗。

4月9日,知危編輯部對比測試了阿裡通義千問、百度文心一言、ChatGPT三家大模型在中文語義方面的解讀, 結果顯示,1、對帶有場景和語氣的語義理解能力方面三者之間有高有低,不分伯仲,尤其是對刁鉆的中文句子的理解方面,ChatGPT不如通義千問和文心一言。

2、在邏輯、推斷能力上,三家的水平也是旗鼓相當,而通義千問似乎更嚴謹一點,某些時候能考慮到更多因素。

3、文心一言在人文文學領域稍強;通義千問在報告文章方面稍強,尤其擅長科學類知識,基本與 ChatGPT《 3.5 版本 》持平或稍有一些瑕疵;ChatGPT 則是比較均衡。

據悉,早在2021年,華為雲就發佈了盤古系列超大規模預訓練模型,包括 30億參數的視覺《CV》預訓練模型,以及華為雲與循環智能、鵬城實驗室聯合開發的具有千億參數、40TB 訓練數據的中文《NLP》預訓練模型。

在2021年的中文語言理解評測基準 CLUE 榜單中,盤古 NLP 大模型在總排行榜及分類、閱讀理解單項均排名第一,刷新三項榜單世界歷史紀錄;總排行榜得分 83.046,多項子任務得分業界領先,接近人類水平《85.61》。

公開數據顯示,華為盤古 NLP 大模型早在2021年就具有千億參數,阿裡通義千問號稱是世界首個突破 10 萬億參數的 AI 大模型,阿裡還牽頭搭建了國內國模最大的 AI 模型服務社區 『 魔搭 』;百度文心一言的數據參數級別是1.5萬億級別。

ChatGPT-3模型使用了1750億個參數, ChatGPT-4的參數更多,而且訓練數據來源於截至 2021 年 9 月的各種類型的文本,如網頁、書籍、論文、新聞等,這些數據涵蓋了廣泛的主題和領域。

談到國產AI大模型與ChatGPT的差別,華東政法大學人工智能與大數據指數研究院院長高奇琦教授在接受《解放日報》采訪時表示,通用大模型是一個系統工程,算法、數據和算力這三個因素至關重要。

目前,國內外的差距主要集中在數據和算力。

在數據方面,英文數據質量比較高,也更便於清洗。

ChatGPT回答得好的原因主要就是互聯網上有大量比較準確的英文知識類信息,有利於模型訓練。

中文數據也很多,但質量有差距,而且國內數據大量儲存於移動端APP中,比較難於抓取,互聯網巨頭之間的數據又相互封閉,數據孤島化情況嚴重。

算力是另一個巨大的挑戰,ChatGPT需要至少3萬張英偉達A100卡的算力 ,而單張A100/40G的價格超過7萬元,這 筆投資巨大。

相比國外ChatGPT由微軟等大企業、大資本投資,如果國內要追趕,需要國家層面的算力投資和支持。

國產AI大模型更關注產業應用

ChatGPT-4是一個多模態大型語言《NLP》模型,即支持圖像和文本輸入,以文本形式輸出; 在『模擬人類』的文本輸出方面達到領先水平; 相比之下,國內大模型種類多樣,目前更註重探索產業應用,用於解決產業技術壁壘問題。

舉例來說,華為盤古大模型的研發目標是通過模型泛化,解決傳統AI作坊式開發模式下不能解決的AI規模化、產業化難題。

具體來看,NLP大模型對應內容生產和內容理解;CV大模型為分類、分割和檢測;多模態大模型具備跨模態檢索、跨模態生成、看圖說話四種能力;科學計算大模型則分為分子大模型、金融大模型和氣象大模型。

華為雲盤古預訓練大模型已完成從學術大模型到產業大模型的轉變,形成了『基礎大模型-行業大模型-細分場景大模型』的發展路徑,並且在醫療、互聯網、金融、煤礦、農業、氣象等領域中實現降本增效。

盤古氣象大模型是首個精度超過傳統數值預報方法的AI方法,預測精度在1小時到7天內均高於傳統數值方法《歐洲氣象中心的operational IFS》。

同時,該模型還能夠提供秒級的全球氣象預報,包括位勢、濕度、風速、溫度、海平面氣壓等信息。

西安交通大學第一附屬醫院《以下簡稱西安交大一附院》劉冰教授在新藥研發的工作中采用了基於華為雲盤古藥物分子大模型打造的AI輔助藥物設計服務,突破性地研發出一款超級抗菌藥Drug X,並打破了醫藥界『雙十定律』——一款創新藥從研發到上市,平均成本超過10億美元、研發周期大於10年。

Drug X有望成為全球近40年來首個新靶點、新類別的抗生素,其靶點特質決定了細菌將難以對Drug X產生耐藥性,對抗瘧《即瘧原蟲》藥物研發等多個領域有著重要的影響。

華為雲盤古藥物分子大模型讓先導藥的研發周期從數年縮短至一個月,研發成本降低70%。

早在2022年阿裡也將AI應用於電力調度,聯合電網研發出的高精度電網負荷預測模型,已經在山東德州落地。

該模型的母線負荷預測準確率在AI介入後,能將預測耗時從之前的1個多小時縮短為幾分鐘,可以有效應對大規模光伏並網帶來的沖擊,促進了電網安全穩定運行。

巡檢機器人在電網領域的落地應用也比較成熟。

巡檢機器人通過高精度定位,以及AI語音、圖像等識別技術,能夠在惡劣環境下完成人工很難完成的作業,通過規模化作業,大幅度提高作業效率,甚至通過深度學習技術,能夠針對臺風等自然災害進行電網災害風險動態評估。

百度文心一言則更偏向於文學創作、商業文案創作、數理推算、中文理解、多模態生成等方面的能力,希望實現行業知識的數字化、模型化,從而推動AI應用的規模化。

據百度有關人士介紹,傳統行業企業擅長構建產業級模型庫,百度缺乏行業經驗,但可以將厚重的專業知識訓練成AI模型,雙方聯手可以共創有價值的AI行業大模型,比如企業把無形的行業經驗為翻譯為數據『原料』,大量的優質原料投入到百度AI訓練框架中,大數據經過大算力『暴力烹飪』形成大模型。

百度表示,隻有補齊了產業數據短板,企業級數據資產的賺錢才有可能像GPT-4一樣實現質的飛躍: 預置了『高工級』知識圖譜的AI模型,按照摩爾定律的訓練速度,帶來生產流程的提效、工具降本、風險預判、商機洞察等。

目前百度已經與國網、浦發等行業頭部聯合打造了能源電力、金融行業模型,產業級模型庫已經開跑。

模型即服務《MaaS,model as a service》也有望成為未來的新型整合式雲計算提供方式。

目前已有650家夥伴加入文心一言生態。

談到國內外AI大模型的差距,中國信通院有關人士也表示,國產AI大模型更能夠滿足國內行業需求,而 ChatGPT的主流數據集和評估基準多以英文為主,缺少中文,缺乏對國內產業的理解,難以滿足國內關鍵行業應用需求。

這也為國產AI大模型的發展提供了契機。