繼昨日凌晨GPT-4發佈之後,百度緊急預告了文心一言的發佈。
作為國內第一個面向大眾群體的大語言模型,文心一言被人們寄予了厚望,甚至出現了其將成為中國AI新舊時代劃分裡程碑的判斷。
但其實在此之前,百度的『文心』陣營早已成型,涵蓋文心大模型、工具與平臺、產品與社區三個層級,本次發佈的文心一言,即是產品與社區中的一員,與之前發佈的文心一格《AI藝術和創意輔助平臺》等產品是兄弟關系。
被寄予萬千期待的『中國版ChatGPT』文心一言到底表現如何,今天的發佈會終於為我們揭曉答案。
01
文心一言的五大能力
在李彥宏演講環節,首先公佈了文心一言的五大能力,即文學創作、商業文案創作、數理邏輯推算、中文理解、多模態生成。
1、文學創作
在文學創作能力方面,李彥宏向文心一言提出幾個問題《提前錄制好的演示視頻》:包括《三體》的作者是哪裡人、從哪些角度可以續寫《三體》、如何從哲學角度續寫,演員張魯一和於和偉的身高對比等。
在演示中,文心一言準確地回答了《三體》作者的籍貫,並列出4個可以續寫的方向,甚至從哲學角度給出了續寫《三體》的幾個梗概方向。
李彥宏表示,這幾輪問答體現出文心一言總結分析、推理能力,對於一個生成式大模型來說,能把這些問題都答對並不容易,文心一言可以相對保證事實性的內容比較準確。
2、商業文案創作
對於很多人關心的文心一言在商業內容的生產力方面,百度展示了文心一言生成公司名稱、slogan、新聞稿三方面的能力。
可以看出,文心一言在中文語境下面對商業問題的處理,確實有望與GPT-4一決高下。
3、數理邏輯推算
這一環節,李彥宏提出了經典的『雞兔同籠』問題,這也是早期導致ChatGPT『翻車』的問題之一。
但在演示中,文心一言確實表現出了強大的數理計算和推理能力。
第一次提問故意把題目出錯,文心一言發現算不出來時,會提示『是不是題出錯了?』並在題目更正後給出了正確答案。
不僅知道題對不對,也不僅給出答案,文心一言還給出了詳細的解題步驟,很像真實的學生解題過程。
李彥宏表示,在百度過去的內測中,雖然還不能百分百保證把題目做對,但能看到能力一直在進步。
4、中文理解
作為中文互聯網界的搜索引擎大廠,百度對中文的理解遠超其他互聯網企業,李彥宏也表示:『文心一言對中文的理解應該超出世界上任何一個大模型』
這一環節,李彥宏分別讓文心一言對成語『洛陽紙貴』做出解釋、告訴用戶洛陽的紙到底有多貴,分析其經濟學原理,並用『洛陽紙貴』寫一首藏頭詩。
文心一言均做出了比較完美的回答。
5、多模態生成
在文心一言發佈會的前一日GPT-4剛剛發佈,並憑借對圖片的多模態處理能力狠賺了一波眼球,好在,文心一言在發佈之初就要具備這項能力了。
演示環節中分別讓文心一言根據圖片生成一張海報,一段視頻,並將一段文字用四川話『讀』了出來。
圖片生成的能力雖不如GPT-4驚艷,但現階段能做到如此程度已實屬優秀。
視頻能力則是意外之喜,相信會解放很多視頻內容工作者的生產力。
可惜的是,李彥宏表示生成視頻因計算成本較高,暫未開放,但百家號的創作者,每天有幾萬篇的視頻內容,其實已經在用這個技術在進行創作和分發。
對這五大能力,李彥宏強調:從對文心一言的體驗看,其已經具備了一部分人類的理解能力,並在不斷完善之中,在使用時會驚喜,會發生錯誤,但可以肯定的是,它的進步速度很快。
在介紹產品之後,李彥宏還解釋了文心一言是怎麼做出來的,以及百度在AI時代的獨特優勢。
李彥宏稱,進入AI時代後,IT技術棧從三層變為四層,芯片層從CPU變為GPU,文心一言處於模型層,AI時代的應用,會基於大模型進行開發,之後不管是搜索、聊天還是其他,都會基於預訓練大模型進行開發。
百度每天有數十億的問答,文心一言之後也會在這個量級,生成式AI非常耗費算力,費用相當昂貴,但四層架構之間相互進行協同,優化,可以使效率比別人高很多,並降低成本。
框架層的協同已經讓百度在過去幾個月的測試期間享受到了效率的收益。
在全球范圍內,在四個層級都擁有領先產品的,百度是世界唯一,這將大大支持文心一言的迭代速度。
02
中國需要有自己的GPT
很多人在發佈會前會問一個問題:百度版的ChatGPT為什麼現在發佈?李彥宏的回答是:因為客戶需要。
百度深耕國內市場多年,積累了眾多B端客戶,據百度所說,其中相當多的客戶希望百度能盡快發佈文心一言。
在這之外,李彥宏也在發佈會現場表示,文心一言其實在19年就發佈了,每年也都會發佈新版本,但現在因為ChatGPT和GPT-4的發佈,用戶心理預期是要對標GPT-4的,這直接拉高了技術門檻。
百度是全世界大型互聯網企業中第一個發佈大語言模型的,微軟是直接調用GPT,google,Meta等並沒有發佈。
雖然能明顯看出,發佈會上的李彥宏希望盡量降低用戶預期,並反復強調文心一言發佈後會不斷、快速的進步,但市場似乎並不買賬,截至發稿時,百度的股價已閃崩9%,用戶的關注度也並沒有放在文心一言產品本身上,而是在關注李彥宏的緊張和顫音、全程沒有實際體驗,以及需要邀請碼才能體驗的機制上。
但正如李彥宏所說,文心一言不是中美對抗的工具,而是百度一代代技術人員追求的結果,是服務億萬客戶的最新平臺,更是創新驅動發展的證明。
文心一言十月懷胎,一朝分娩,作為用戶,可能也需要給文心一言、給百度,足夠的時間。
彩蛋:
文心一言的英文名叫『Ernie』,取自美國公共廣播協會制作播出的兒童教育電視節目《芝麻街》,之所以取這個名字,是因為百度老冤家google的自然語言模型『Bert』同樣來自於《芝麻街》,多少有些『相愛相殺』的味道。
作者:鶴山 排版:駱偉玲
圖片源於Q仔互聯網沖浪所得,若有侵權,後臺聯系,Q仔滑跪刪除~