編輯:好困
『新智元導讀』近日,元語智能團隊又開源了一個ChatYuan系列大模型:ChatYuan-large-v2,支持在單張消費級顯卡、PC甚至手機上進行推理使用。
剛剛,「國產ChatGPT」ChatYuan又發新版本了。
更新的ChatYuan-large-v2不僅支持中英雙語,還支持輸入輸出總長度最長4k。
而這也是繼此前PromptCLUE-base、PromptCLUE- v1-5、ChatYuan-large-v1 模型之後,元語智能再次推出大模型方向的研究成果。
開源項目地址:
https://github.com/clue-ai/ChatYuan
Huggingface:
https://huggingface.co/ClueAI/ChatYuan-large-v2
Modelscope:
https://modelscope.cn/models/ClueAI/ChatYuan-large-v2/summary
01 什麼是ChatYuan-large-v2?
ChatYuan-large-v2是一個支持中英雙語的功能型對話語言大模型,ChatYuan-large-v2使用了和 v1版本相同的技術方案,在指令微調、人類反饋強化學習、思維鏈等方面進行了優化。
ChatYuan-large-v2是ChatYuan系列中以輕量化實現高質量效果的代表模型,僅僅通過0.7B參數量可以實現業界10B模型的基礎效果,並且大大降低了推理成本,提高了使用效率。
用戶可以在消費級顯卡、 PC甚至手機上進行推理《INT4 最低隻需 400M 》。
同時,為了更好的提升使用體驗,團隊已經封裝了工具,Chatyuan-large-v2實現了本地可運行,下載後可以直接在本地使用h5版本,進行網頁交互。
02 v2有什麼升級?
在chatyuan-large-v1的原有功能的基礎上,v2模型進行了如下優化:
- 增強了基礎能力:原有上下文問答、創意性寫作能力明顯提升。
- 新增了拒答能力:對於一些危險、有害的問題,學會了拒答處理。
- 新增了代碼生成功能:對於基礎代碼生成進行了一定程度優化。
- 新增了表格生成功能:優化了生成的表格內容和格式。
- 增強了數學運算能力:對基礎數學運算如加減法做了優化。
- 擴展輸入輸出總長度:最大長度token數擴展到4096。
- 增強了模擬情景能力:可以模擬多人對話或者具體場景,在情景下進行內容創作及上下文交互。
- 新增了中英雙語對話能力:新增了中英雙語交互、英文創作、翻譯等功能。
拒答能力
計算推理
模擬情景
表格生成
代碼生成
03 v2的局限性
由於Chatyuan-large-v1是一個輕量化的大模型,所以仍會存在一些局限和不足,請開發者知悉,包括:
- 對於推理、計算、代碼生成方面基礎功能基本實現,仍存在訓練不充分的問題,在某些場景下會出現邏輯錯誤情況,如代碼基本能夠實現且具備註釋能力,但不能保證精簡通順和準確,可視性還需優化。
- 通用知識回答不夠精確,事實性知識仍存在不準確的情況。
- 上下文關聯信息處理尚有不足。
結語
總體而言,v2在上下文理解、內容生成、代碼表格生成等方面,較v1開源模型有較大提升,僅僅通過0.7B參數規模即可實現行業內百億參數規模的基礎效果,大幅降低推理成本,提升了使用效率。
元語智能表示,團隊會堅定的堅持開源路線,後續將持續開源更好更大的通用大模型,持續構建開源開發者生態,推動國內大模型開源發展,希望各位朋友批評指正。
產品內測邀請
除了本次開源ChatYuan-large-v2模型之外,元語團隊正式開啟KnowX產品內測,KnowX搭載了ChatYuan線上最新版本的大模型能力,在上下文理解、內容生成、代碼生成、邏輯推理計算等方面表現優異,為實現版本的可靠、穩定及進一步優化,現已開啟產品內測,名額有限,感興趣的朋友可在下方鏈接中申請。
內測申請通道:
https://wj.qq.com/s2/11984341/e00b/
參考資料:
https://mp.weixin.qq.com/s/NahO52ZwFDjU0CMxfgRhQw