國產ChatGPT又開源了!效果大幅升級,在手機上也可以跑。

編輯:好困

『新智元導讀』近日,元語智能團隊又開源了一個ChatYuan系列大模型:ChatYuan-large-v2,支持在單張消費級顯卡、PC甚至手機上進行推理使用。

剛剛,「國產ChatGPT」ChatYuan又發新版本了。

更新的ChatYuan-large-v2不僅支持中英雙語,還支持輸入輸出總長度最長4k。

而這也是繼此前PromptCLUE-base、PromptCLUE- v1-5、ChatYuan-large-v1 模型之後,元語智能再次推出大模型方向的研究成果。

國產ChatGPT又開源了!效果大幅升級,在手機上也可以跑。

開源項目地址:

https://github.com/clue-ai/ChatYuan

Huggingface:

https://huggingface.co/ClueAI/ChatYuan-large-v2

Modelscope:

https://modelscope.cn/models/ClueAI/ChatYuan-large-v2/summary

01 什麼是ChatYuan-large-v2?

ChatYuan-large-v2是一個支持中英雙語的功能型對話語言大模型,ChatYuan-large-v2使用了和 v1版本相同的技術方案,在指令微調、人類反饋強化學習、思維鏈等方面進行了優化。

ChatYuan-large-v2是ChatYuan系列中以輕量化實現高質量效果的代表模型,僅僅通過0.7B參數量可以實現業界10B模型的基礎效果,並且大大降低了推理成本,提高了使用效率。

用戶可以在消費級顯卡、 PC甚至手機上進行推理《INT4 最低隻需 400M 》。

同時,為了更好的提升使用體驗,團隊已經封裝了工具,Chatyuan-large-v2實現了本地可運行,下載後可以直接在本地使用h5版本,進行網頁交互。

02 v2有什麼升級?

在chatyuan-large-v1的原有功能的基礎上,v2模型進行了如下優化:

  • 增強了基礎能力:原有上下文問答、創意性寫作能力明顯提升。
  • 新增了拒答能力:對於一些危險、有害的問題,學會了拒答處理。
  • 新增了代碼生成功能:對於基礎代碼生成進行了一定程度優化。
  • 新增了表格生成功能:優化了生成的表格內容和格式。
  • 增強了數學運算能力:對基礎數學運算如加減法做了優化。
  • 擴展輸入輸出總長度:最大長度token數擴展到4096。
  • 增強了模擬情景能力:可以模擬多人對話或者具體場景,在情景下進行內容創作及上下文交互。
  • 新增了中英雙語對話能力:新增了中英雙語交互、英文創作、翻譯等功能。

拒答能力

計算推理

模擬情景

表格生成

代碼生成

03 v2的局限性

由於Chatyuan-large-v1是一個輕量化的大模型,所以仍會存在一些局限和不足,請開發者知悉,包括:

  • 對於推理、計算、代碼生成方面基礎功能基本實現,仍存在訓練不充分的問題,在某些場景下會出現邏輯錯誤情況,如代碼基本能夠實現且具備註釋能力,但不能保證精簡通順和準確,可視性還需優化。
  • 通用知識回答不夠精確,事實性知識仍存在不準確的情況。
  • 上下文關聯信息處理尚有不足。

結語

總體而言,v2在上下文理解、內容生成、代碼表格生成等方面,較v1開源模型有較大提升,僅僅通過0.7B參數規模即可實現行業內百億參數規模的基礎效果,大幅降低推理成本,提升了使用效率。

元語智能表示,團隊會堅定的堅持開源路線,後續將持續開源更好更大的通用大模型,持續構建開源開發者生態,推動國內大模型開源發展,希望各位朋友批評指正。

產品內測邀請

除了本次開源ChatYuan-large-v2模型之外,元語團隊正式開啟KnowX產品內測,KnowX搭載了ChatYuan線上最新版本的大模型能力,在上下文理解、內容生成、代碼生成、邏輯推理計算等方面表現優異,為實現版本的可靠、穩定及進一步優化,現已開啟產品內測,名額有限,感興趣的朋友可在下方鏈接中申請。

內測申請通道:

https://wj.qq.com/s2/11984341/e00b/

參考資料:

https://mp.weixin.qq.com/s/NahO52ZwFDjU0CMxfgRhQw