雷達財經出品 文|孟帥 編|深海
在萬眾矚目的期待之下,國內搜索引擎巨頭百度研發的類ChatGPT應用文心一言終於在3月16日揭開了自己的神秘面紗。
作為內測邀請對象的雷達財經體驗發現,文心一言可以根據用戶的指令生成相應的文字內容,並且具備連續對話的能力;當用戶提出生成代碼、音頻的要求時,文心一言也可以做出相應的響應。
綜合來看,在文學創作、商業文案創作、數理推算、中文理解和多模態生成等多個場景中,現階段的文心一言已具備一定的實力。
『內測中的文心一言並不完美,但市場有需求必須要推出來』,但正如百度創始人李彥宏說的那樣,目前推出的文心一言的確還有可以完善和改進的空間。
在雷達財經體驗的過程中,文心一言出現了一些解答錯誤或無法解答的情況。
有業內人士分析認為,文心一言的推出對於百度而言很有必要。
一方面,百度在AI領域的多年深耕及持續不斷的高額研發投入,使其在推出類ChatGPT應用時具備了一定的技術實力,以文心一言為代表的人工智能業務或將為其創造更多營收和盈利的可能;另一方面,作為一款人工智能語言模型,文心一言除了已有的訓練數據外,還需要獲得更多來自真實用戶的反饋,才能得到進一步的優化和完善。
能聽、會寫、可說、擅畫
『文筆流暢詩賦閑,心曠神怡醉自然。
一曲高歌傳天籟,言之有情口皆碑』,前面的這首藏頭詩,正是在雷達財經輸入相關指令的『調教』下由文心一言創作出的內容。
事實上,能寫出一首暗藏玄機的藏頭詩,還隻是文心一言強大功能中的很小一部分。
在百度3月16日舉辦的文心一言新聞發佈會上,百度創始人李彥宏向外界展示了文心一言的諸多功能,如為科技服務公司起名、起Slogan、撰寫新聞稿;總結《三體》的核心內容、提供續寫《三體》的角度;當李彥宏提出雞兔同籠的問題時,文心一言還可以分析出題目中的錯誤……
作為此次被邀請內測文心一言的對象之一,雷達財經第一時間體驗了這款備受外界關注的基於人工智能語言模型的產品。
當雷達財經想讓文心一言寫一篇百度於3月16日舉行的與文心一言相關的發佈會的新聞稿時,文心一言的確生成了一篇還算像模像樣的新聞稿,『北京時間3月16日,百度在北京總部召開了一場名為『文心一言』的發佈會,宣佈推出旗下預訓練生成式大語言模型產品——文心一言……』
當雷達財經向其提出有關雷達財經自身行業地位的問題時,文心一言從專業性、權威性、獨立性、創新型四個方面進行了闡釋,並做出了『雷達財經在行業內具有一定的地位和影響力,是值得關注和借鑒的財經新媒體之一』的概括。
當雷達財經又分別提出』中國互聯網大佬裡誰最聰明『和『中國互聯網大佬裡誰最帥』的問題時,文心一言給出的答案分別是馬化騰、王思聰。
在回答第一個問題時,文心一言還補充稱,『除了馬化騰,還有許多其他的中國互聯網大佬也很聰明,比如李彥宏、劉強東、雷軍等。
不過,每個人的智商水平都是因人而異的,我們不能簡單地通過某個特定的標準來評價一個人的聰明程度』。
雷達財經還將『先有的雞還是先有的蛋』這個困擾了無數人的問題交給了文心一言。
對此,文心一言從生物學、演化論以及從哲學、倫理學的角度分別為雷達財經進行了解釋。
值得一提的是,文心一言還具備處理表格的能力。
當雷達財經交給文心一言一組數據後,對方很快便按要求生成了相應的表格。
除了在文字方面的能力外,文心一言甚至還能按照用戶輸入的指令作畫,比如當雷達財經輸入『幫我畫一個文心一言的可愛風格的擬人畫』的要求時,文心一言畫出了下面這樣一副畫作。
當雷達財經提出用方言讀出某段文字、生成一段簡單的代碼的要求時,文心一言均可以輕松應對。
比較遺憾的是,由於生成視頻的成本相對較高,李彥宏在發佈會上展示的文心一言生成視頻的能力,暫時還未對所有用戶開放,因此雷達財經尚未體驗到文心一言按照某段文字生成視頻的功能。
不過,李彥宏透露未來會逐步接入該功能。
能聽、會寫、可說、擅畫……文心一言功能的多樣化,讓雷達財經再一次產生了『人工智能未來是否將取代人類?』的疑問。
而面對人工智能發展過快是否會影響人類命運這個讓許多人擔憂的的問題時,文心一言表示,『這類技術並不會取代人類,因為它是由人類發明的,它的發展取決於人類的意圖和監管。
更為最重要的是,人類有獨特的智慧和創造力,這是人工智能永遠無法模仿和取代的』。
文心一言仍有不足
雷達財經了解到,文心一言目前邀請用戶內測的版本號為V1.0.0。
在此次產品正式發佈之前,市場上首次傳出與文心一言相關的消息是在今年的2月。
彼時,有媒體從百度內部獲悉,百度版的ChatGPT正在馬不停蹄地進行上線前的準備工作。
天眼查顯示,自今年2月7日起,百度在線網路技術《北京》有限公司已申請註冊多個與『文心一言』、『文心一言 ERNIE BOT』相關的商標,國際分類涉及通訊服務、科學儀器、教育娛樂、廣告銷售等,當前商標狀態多為『商標申請中』或『等待實質審查』。
此外,還有多個自然人和企業對文心一言相關的商標進行搶註。
據李彥宏在此前的財報電話會上透露,百度計劃將多項主流業務與文心一言整合,其中便包括搜索、百度智能雲、Apollo 智艙系列產品、小度等諸多業務。
雷達財經梳理發現,除了與自家的產品進行深度整合外,百度的文心一言目前也與諸多外部公司達成合作,如愛奇藝、攜程、美的、巨人網路、新京報、汽車之家、36氪、臺媒體等多家互聯網、媒體及其他領域的公司;3月16日文心一言的發佈會當天,長安汽車又宣佈旗下的逸達將成為國內首款搭載百度『文心一言』的量產車型。
另據百度方面公佈的數據顯示,目前排隊申請文心一言企業版API調用服務測試的企業用戶超過7.5萬個,與百度智能雲基於文心一言展開合作的咨詢已達6080條。
作為百度拿出的與Open AI團隊打造的ChatGPT對標的重磅產品,文心一言免不了被拿來同ChatGPT做比較,於是雷達財經直接將這個問題交給了文心一言,對方列出了其在易得性、多語言支持、高興性及應用場景幾個維度的優勢。
國金證券在其研報中也指出,目前百度文心生成式語言大模型在參數規模、技術創新、應用落地方面均在國內同業中處於領先水平。
相較於ChatGPT等海外模型存在連接限制,百度文心平臺可以為國內用戶提供更便捷的技術入口。
不過,雷達財經注意到,除了『文心一言在國內的使用難度明顯較低』這個優勢之外,ChatGPT似乎同樣具備文心一言列出的其他優勢。
與此同時,文心一言也直言自己存在一些劣勢,『比如自己在某些任務上的準確性可能不如ChatGPT,或者需要更多的訓練數據才能達到相同的水平等』。
事實上,在雷達財經體驗文心一言時,文心一言的確出現了失誤或者不能為用戶提供解答相關問題的情況。
當雷達財經向文心一言拋出『網劇《狂飆》中你認為哪個角色最出彩』的問題時,對方給出的答案中的高翔、沈欣、李爽及相關故事線,顯然與此前大熱的《狂飆》劇集中的角色及劇情有所出入。
當雷達財經故意提出帶有誤導性的問題『小羅伯特·唐尼為什麼不再扮演美國隊長這一角色』時,文心一言也開始『胡言亂語』起來,『在《復仇者聯盟》系列電影中,唐尼飾演了鋼鐵俠和美國隊長這兩個重要角色,但是由於他的片酬提高了,漫威影業無法支付他相應的報酬,因此雙方沒有再續約的意向』。
又比如當文心一言按照用戶的指令生成新聞稿時,會出現忽略用戶在文本字數方面提出要求的情況。
在雷達財經提出生成150字以內新聞稿的要求下,文心一言最終生成了一段超過400字的文稿。
當雷達財經想通過文心一言獲取百度2020年至2022年的營收數據時,對方則表示,『很抱歉,作為一個人工智能語言模型,我沒有關於百度2020年至2022年的營收數據』。
事實上,作為百度剛剛推出尚處於內測階段的文心一言,的確有需要不斷完善和改進的空間。
比如在中文大環境下誕生的文心一言,雖然在對中文的理解能力上有先天優勢,但李彥宏也在文心一言的發佈會上坦言,『文心一言目前對英文語種、代碼場景的訓練還不夠多,表現還不夠好,接下來百度還要加緊訓練,不斷完善這些能力』
『十月懷胎,一朝分娩』
對於文心一言的誕生,李彥宏將其稱之為『十月懷胎,一朝分娩』,李彥宏也深知對標ChatGPT的門檻很高,並表示百度是全球大廠中第一個做出來的。
事實上,類似ChatGPT和文心一言這種需要深度學習、大量訓練的語言模型,絕非一朝一夕即可輕松復制,這背後需要研發團隊多年的技術積累和龐大的訓練數據支持。
據了解,百度是目前全球為數不多的在四層進行全棧佈局的人工智能公司。
從高端芯片昆侖芯,到飛槳深度學習框架,再到文心預訓練大模型,到搜索、智能雲、自動駕駛、小度等應用,百度在各個層面都有領先業界的自研技術。
此次發佈的文心一言,其訓練的數據中涵蓋了萬億級的網頁數據、數十億的搜索數據和圖片數據、百億級的語音日均調用數據,以及5500億事實的知識圖譜等。
據國盛證券估計,類ChatGPT的大模型訓練一次就要燒掉200萬至1200萬美元的資金。
因此支撐百度大力發展包括文心一言在內的人工智能業務的決心,除了源自其對科技的不懈探索和追求外,還離不開百度雄厚的資金支持。
財報顯示,2022年百度取得1237億元的營收,大致與上年持平。
在過去的五年時間裡,百度的營收始終維持在1000億元以上的水準。
盡管與其他互聯網大廠相比,百度近幾年看起來有些『低調』,但實際上百度卻在『悶聲賺大錢』。
財報顯示,近五年時間,百度除了在2019年錄得22.88億元的凈虧損外,其餘年份均在盈利。
其中,2018年、2020年百度的凈利潤分別達到225.82億元、190.26億元。
去年百度的凈利潤為75.34億元,與此前相比有所下降,大致與2021年75.91億元的凈利潤追平。
雖然百度目前仍在盈利,但百度如何才能重回昔日的高增長態勢仍需要不斷探索,其紮根多年的AI賽道便是百度早早埋下的一顆種子。
與此同時,在互聯網大廠紛紛走上降本增效的大環境下,百度仍在持續加碼自己於研發方面的投入。
財報顯示,2018年、2019年、2020年,百度在研發方面的費用分別為157.72億元、183.46億元、194.13億元;到了2021年,百度的研發費用直接沖破200億元大關,達到249.38億元的高度,與上年相比增加了27.8%。
2022年,百度的研發費用規模雖然相比上年有所回落,但仍保持在200億元以上的高位,全年的研發費用高達233.15億元。
其中,百度用於核心研發的費用為214.16億元,占到百度同期核心收入22.4%的比重。
不過,外界目前對於文心一言所持有的態度並不穩定。
雷達財經了解到,3月16日文心一言發佈會結束當天,百度報收125.1港元/股,股價較前一個交易日下跌6.36%;3月17日,百度股價較前一個交易日又回升13.67%。
對於文心一言發佈後引起的市場對於百度股票價格波動的情況,文心一言解釋稱,這種波動可以被看作是對於公司未來前景的樂觀預期,或者是對於文心一言未來潛力的擔憂。
有分析人士指出,文心一言的發佈,標志著百度在人工智能領域的又一次重大突破,也證明了百度在深度學習、對話式人機交互等方面的領先地位。
通過多年來包括文心一言等業務在內的於人工智能領域的佈局,百度有望打開商業化的更多可能。
不過,該分析人士也表示,目前文心一言尚處於初代版本,還有諸多需要改善和精進的地方。
百度發佈文心一言的前一天,OpenAI搶先一步發佈了GPT-4。
相比此前發佈的ChatGPT,GPT-4的功能更為強大,這對於本就落後ChatGPT一步的百度而言,無疑是更大的挑戰。
但作為一款免不了和用戶打交道的應用,文心一言隻有在與用戶不斷切磋、試錯的過程中才能更快、更好地成長,用戶的反饋對於文心一言而言至關重要。
通過不斷的調整,文心一言在後續不斷迭代的過程中,或將進一步縮小與ChatGPT之間的差距。