ChatGPT火遍全網,卻有一大缺陷。

最近,聊天機器人模型ChatGPT可謂火遍全網。

去年11月30日,由美國人工智能實驗室OpenAI推出的ChatGPT可完成類似人類的文本回復,涵蓋事實信息、對話和創意寫作等任務,具有改變企業與客戶互動方式的潛力,適用於聊天機器人、虛擬助理、語言翻譯和內容生成等多種應用場景。

人工智能技術長期積累的產物

ChatGPT的成功並非一蹴而就,而是源於以深度學習為代表的人工智能技術的長期積累。

早期神經網絡技術秉承人工智能深度學習 『逐層遞進、層層抽象』的基本思想,出現了諸如MCP神經元、感知機和前饋神經網絡等模型。

它們通常由多個處理信息且相互連接的『神經元』組成,其靈感來自人腦中所鏈接神經元之間的信息交換。

1949年,心理學家唐納德·赫佈指出,『神經元之間持續重復的經驗刺激可導致突觸傳遞效能增加,神經元之間突觸的強弱變化是學習與記憶的生理學基礎』赫佈理論為神經網絡研究奠定了認知神經心理學基礎。

在自然語言中,句子均由一個個單詞前後相連組成。

為了處理自然語言這一種序列數據,循環神經網絡被提出。

循環神經網絡適用於處理自然語言這種序列數據,其特點是可存儲前序信息將其作為上下文,以輔助句子理解。

2017年12月,Google發表了論文Attention is all you need,將自注意力機制引入以更高效學習單詞與其上下文單詞之間的共生關系,構建了被稱為Transformer的模型。

研究人員一般采取一種『完形填空』方法來訓練Transformer模型。

給定一個句子,可從句子中『移除』一個單詞,然後讓模型根據剩下單詞的上下文填空,預測最合適的『填空詞』,通過這樣的『自監督學習』不斷強化模型能力。

可以看出,通過『完形填空』就可使用互聯網以及圖書館中海量語料自動訓練模型,從而減少對昂貴標註數據的依賴。

由於ChatGPT需要完成的是聊天問答任務,研究者提出了一種『提示學習』方法改善模型。

在該方法中,將答案句子中某個單詞『移除』,然後把問題句子和答案句子拼合在一起,讓模型預測被移除的單詞。

如此不斷學習,模型就挖掘出了『問』和『答』之間的關聯,具備了根據問題合成答案的能力。

ChatGPT還引入了人類反饋中的強化學習技術,將人類對其所提供答案的判斷反饋給模型,以便對模型參數微調,提高語言模型回答的真實性和流暢性。

可見,人工智能現有基本模型是以邏輯推理為核心的符號主義AI、以數據驅動為核心的連接主義AI《深度學習》、以反饋控制為核心的行為主義AI《強化學習》。

ChatGPT是對現有人工智能方法和技術的創新性整合。

技術特點和不足

在『數據是燃料、模型是引擎、算力是加速器』的驅動下,以深度學習為核心的人工智能正猶如水和電一樣賦能人類社會。

ChatGPT恰如其分地體現了『數據、模型和算力』特點:ChatGPT的訓練使用了45TB的數據、近1萬億個單詞《大概是1351萬本牛津詞典所包含的單詞數量》。

使用了深度神經網絡、自監督學習、強化學習和提示學習等人工智能模型。

訓練ChatGPT所耗費的算力大概是3640 PetaFLOPs per day,即用每秒能夠運算一千萬億次的算力對模型進行訓練,需要3640天完成。

目前披露的ChatGPT的前身GPT-3模型參數數目高達1750億。

如果將這個模型的參數全部打印在A4紙上,一張一張疊加後,高度將超過上海中心大廈《632米》。

在大數據、大模型和大算力的工程性結合下,ChatGPT展現出統計關聯能力,可洞悉海量數據中單詞-單詞、句子-句子等之間的關聯性,體現了語言對話的能力。

ChatGPT以『共生則關聯』為標準對模型訓練會產生虛假關聯和東拼西湊的合成結果,如ChatGPT認真回答『林黛玉倒拔垂楊柳』這樣啼笑皆非的問題,就是缺乏常識下對數據進行機械式硬匹配所致。

2016年3月所出現的人工智能現象級產品AlphaGo以4:1擊敗李世石在互聯網上激起了熱烈討論。

雖然AlphaGo在迎戰李世石之前,已經『閱覽完畢』人類選手所有比賽棋局,並且通過自我對弈『華山論劍』海量虛擬棋局。

但是,李世石在唯一獲勝的一盤中使出了人類選手絕對不可能落子的一招,這一AlphaGo從未見過的落子使其無法從容應對而落敗。

可見,『數據驅動學習』模式下現有人工智能算法在挖掘共生知識方面固然表現出很強的能力,但是應用歸納、演繹、頓悟等能力獲得新的創新知識更難能可貴。

同時,ChatGPT通過所挖掘的單詞之間的關聯統計關系合成語言答案,卻無法明晰判斷答案中內容的可信度,損害基於該模型研發的一系列具體應用模型的有效性,甚至引發偏見,傳播與事實不符、冒犯性或存在倫理風險的毒性信息,產生技術倫理風險。

人和人造物的力量協同

1956年,人工智能從達特茅斯啟航,經歷了三起兩落的曲折歷程,今天我們很幸運地處於其第三次崛起過程中,這得益於深度學習在自然語言、計算機視覺和機器人等領域應用的成功。

1973年發表的『萊特希爾報告』對當時雄心勃勃構造『人類知識水晶球』符號主義人工智能提出了批評,認為『迄今的發現尚未產生當時承諾的重大影響』,人工智能跌入了第一次隆冬。

BBC甚至於當年邀請科學家圍繞『通用機器人是海市蜃樓嗎』進行了一場電視辯論。

20世紀80年代左右,神經網絡在實際應用中作用有限,使得人工智能跌入了第二次低谷。

先後在麻省理工學院和加州大學伯克利分校任教的休伯特·德雷福斯教授以蘭德公司顧問的身份,於1965年發表了《煉金術與人工智能》報告,將當時所進行的神經網絡研究與歷史上的煉金術相提並論,辛辣指出爬上樹梢不等於攀登月球。

人工智能本身還在不斷發展,將其等同於人類大腦是不切實際的想法,認為其超越人類則是杞人憂天。

我們要認識到目前人工智能還處於完成特定任務的『就事論事』階段,邁向通用人工智能是今後面臨的長期挑戰。

人工智能是幫手,將人類從繁冗工作中解放出來,使得人類更專註於獨立思考、綜合判斷、創新思維等工作。

在中國工程院院士潘雲鶴看來,『未來將是人和人工智能共同進化的時代』『科學普及將人類進化中累積知識轉化為人和人造物的力量』。

美國歷史學家斯塔夫裡阿諾斯在《全球通史》一書中贊譽『蒸汽機的歷史意義無論怎樣誇大都不過』,但是蒸汽機必須與紡織工業、冶金行業、交通行業等結合,才能推動人類整體邁入工業革命時代。

同理,電力和計算機等為代表的通用使能技術與其他技術結合,使人類先後進入了電氣化時代和信息化時代。

今天,人工智能已經成為一種通用使能技術,具有增強任何領域技術的潛力,被廣泛應用於農業、制造、經濟、運輸和醫療等領域,發揮很強的『頭雁效應』。

ChatGPT因人而生、因人反饋而演進,人和人造物協同迸發出賦能之力,凡貴通者,貴其能用之也!

《中國科學報》 (2023-02-13 第3版 綜合 原標題為《ChatGPT:爬上樹梢與攀登月球》)

作者:浙江大學人工智能研究所所長、浙江大學計算機科學與技術學院教授

來源 中國科學報 | 作者 吳飛

編輯 謝永利

流程編輯 馬曉雙