ChatGPT火遍全球。
ChatGPT的一大特點是不再像之前的人工智能產品那麼高冷,而是變得平易近人,能讓普通用戶參與互動聊天。
那麼,在專業機構和研究人員眼中,ChatGPT代表了怎樣的水平?就此,新京報新京智庫專訪了中國信通院雲大所人工智能部副主任曹峰。
作為人工智能領域的『國家隊』,曹峰和其所在的中國信息通信研究院團隊,在2022年12月就基於智能對話和大模型等研究工作基礎,對ChatGPT的對話、生成兩項能力進行多維評測並發佈結果,受到產業各界的關注。
ChatGPT在全球處技術領先位置
新京智庫:在AIGC(利用人工智能技術來生成內容)領域,就計算能力與現有技術而言,ChatGPT屬於什麼級別?
曹峰:ChatGPT的計算能力、數據集尚未公佈。
但是從技術的領先性來說,ChatGPT在全球都屬於領先位置,一般來看領先半年到一年左右。
在開放域對話方面,ChatGPT在對話集成的技術、實現的機制、達到的效果、覆蓋的領域等方面均具有絕對優勢。
在特定域對話方面,ChatGPT優勢不明顯。
根據中國信通院於2022年12月開展的評測結果來看,ChatGPT尚難擺脫知識整合和邏輯推理困境,在約束條件下生成能力仍有不足。
短期內無法取代高要求寫作
新京智庫: 2022年12月,中國信通院對ChatGPT的對話、生成兩項能力進行多維評測,評測有哪些發現?
曹峰:根據中國信通院對ChatGPT的測試結果來看,當前ChatGPT支持以下幾大類的文案生成,包括創意寫作:學術類、新聞類、文案類、散文類、詩歌類、戲劇類、小說類、心得類、其他類;命題寫作:主題擬定、風格模仿、文本續寫、格式擬定;摘要生成:學術類、新聞類、散文類、戲劇類、小說類;代碼生成:原始生成、錯誤修復。
從結果上看,ChatGPT在開放域內容創作上表現較好,但在命題寫作、摘要生成等約束條件下生成能力仍有不足。
可以看出,當前ChatGPT僅僅能代替一些開發類的文案協作,如果增加一些限定條件,那麼其性能就會較大幅度的下降。
所以短期內,它是無法代替具有高要求,高限定場景下的寫作需求的。
在多個方面取得重要突破
新京智庫:有人說ChatGPT具有裡程碑的意義,你怎麼看?
曹峰:在產業熱度上,ChatGPT發佈至今已獲得前所未有的關注度。
ChatGPT僅用兩個月就實現了上億用戶目標,成為史上用戶數量增長最快的消費者應用。
這種熱度還在持續提升。
ChatGPT引發科技浪潮,吸引Google、Microsoft、Amazon、百度、騰訊、竹間等國內外企業的積極佈局。
在技術實現上,集成多種前沿技術並采用先進的訓練方式。
ChatGPT作為大規模語言模型,借助預訓練學習、微調學習、提示學習和強化學習等技術手段,不斷借助人類反饋,實現了更強的自我學習能力。
此外,ChatGPT在更廣泛復雜的數據集上采用了更為通用的預訓練方式,能捕捉到人類語言不同題材的特征,從而可以面向特定領域和場景做進一步的微調。
在應用表現上,ChatGPT交互語言多樣、能力豐富、機制全面。
ChatGPT支持英文、中文、日語等多語言交互,除擅長的對話問答能力外,還具備代碼生成、論文寫作、詩詞創作等內容創作能力。
相比於同一家族的GPT-3模型,ChatGPT在復雜語句理解、上下文語義銜接、錯誤內容糾正、質疑不合理前提、拒絕惡意提問等方面取得重要突破。
ChatGPT目前相當於一個『玩具』
新京智庫:近期,OpenAI傳出即將發佈GPT-4的消息。
據分析,升級版的GPT模型在技術上會有更大的提升,能夠準確執行更接近人類能力的任務。
ChatGPT未來還會有怎樣的發展?
曹峰:我們注意到OpenAI已經預告即將發佈GPT-4。
據稱,與GPT-4相比,ChatGPT就相當於是一個『玩具(toy)』。
我們已經看到ChatGPT所能帶來的巨大可能,GPT-4可能在功能、性能等方面遠遠超過現在的ChatGPT。
中國相關產品值得期待
新京智庫:國內是否有類似的技術或產品?與其相比有哪些差距?
曹峰:當前中國並沒有直接對標ChatGPT的產品,但是我們看到,2月7日,百度正式對外官宣類ChatGPT項目『文心一言』(ERNIE Bot)。
該產品目前正在做上線前的沖刺,將於三月份完成內測,面向公眾開放。
另據報道,阿裡版聊天機器人ChatGPT正在研發中,目前處於內測階段。
實際上,國內智能對話相關產品很多,並已經出現了很多年。
百度、騰訊、思必馳、竹間、圖靈人工智能研究院均推出相關對話開發平臺和產品。
目前,我們看到阿裡、騰訊都在內部測試相關的產品,可以期待中國相關產品的能力和表現。
文/新京報記者 柯銳 實習生 韓朝璐