能讀圖、考高分、1秒生成網站……火爆全網後,ChatGPT撕掉『Chat』的標簽再次進化。
3月15日凌晨,OpenAI正式發佈了升級後的GPT-4。
與之前相比,GPT-4不僅展現了更加強大的語言理解能力,還能夠處理圖像內容,在考試中的得分甚至能超越90%的人類。
不過從商業應用角度而言,目前GPT-4沒有免費版本。
與此同時,壓力也再一次給到正加班加點鏖戰『中國版ChatGPT』的各家大廠這邊。
『大人,時代變了』
發給聊天機器人一張圖表,它不但能看懂,還能給你如此這般做一番運算,發來一段對圖表的解讀。
你不服氣,又扔過去一張無厘頭的梗圖,它不但能看懂這張圖裡有車有人,還能告訴你之所以好笑是因為『這個男人在出租車上面熨衣服』。
這不是暢想,而是OpenAI最新發佈的大型多模態GPT-4已經具備的能力。
在官方演示視頻中,OpenAI總裁兼聯合創始人格雷格·佈羅克曼《Greg Brockman》用筆和紙畫了個網站展示給GPT-4,後者僅用1到2秒的時間,就生成了網頁代碼、制作出了幾乎與圖中一模一樣的網站。
目前,ChatGPT的Plus訂閱用戶已經可以使用GPT-4,其他用戶需要排隊申請內測。
當晚,大批新訂用戶湧入,以至於OpenAI的付款系統被擠爆了。
『GPT-3或3.5像一個六年級學生,而GPT-4像一個聰明的十年級學生』有美國初創企業人士這樣評價。
而在國內,即便發佈時間在凌晨,依然有不少用戶不眠不休地測試:或用來出營銷策劃、寫廣告詞;或用於解答邏輯題、數學題;甚至還有用來調侃腦筋急轉彎。
GPT-4均對答如流,並展示出其強悍的處理能力,用戶直呼『強得離譜』『牛啊』。
天使投資人、資深人工智能專家郭濤對北京商報記者表示,GPT-4在此前的基礎上對訓練數據、模型結構和生成方式等方面都進行了改進,支持圖像和文字多模態輸入、訓練數據更加豐富和多樣化、模型結構也更加復雜和高級等,智能問答和文本生成等領域優勢更加突出,應用場景也更加廣泛。
不過,OpenAI也在官方網站上給出了目前GPT-4存在的不足,如其仍然存在包括社會偏見、捏造事實、對抗生成等已知限制。
OpenAI對此表示,隨著社會對AI模型的接受,將增加透明度,鼓勵並促進用戶教育和更廣泛的人工智能素養,並致力於擴大人們在培養AI模型方面的輸入途徑。
當北京商報記者提問ChatGPT是否了解GPT-4,ChatGPT回答道,『我了解的知識隻截至2021年4月,此時還沒有關於GPT-4的官方公告或發佈日期。
但預計OpenAI將繼續開發和改進其語言模型,這最終可能導致將來發佈新版本的GPT。
作為一名語言模型,我一直在學習和適應新的數據和技術進步,所以我將繼續隨著這些發展而發展』。
變現不是問題
從商業應用角度而言,目前GPT-4沒有免費版本。
用戶可以申請使用GPT-4的API,定價為每輸入1000個字符(約合750個單詞),價格為0.03美元;而GPT-4每生成1000個字符,價格為0.06美元。
與前一代模型相比,新推出的GPT-4 API價格提高不少。
3月2日,OpenAI剛剛放出ChatGPT API,比之前的GPT-3.5模型便宜10倍,每生成1000字符,價格為0.002美元,即2美元就可輸出100萬個字符。
越貴越不愁賣。
浙江大學國際聯合商學院數字經濟與金融創新研究中心聯席主任、研究員盤和林指出,GPT-4一經發佈,支付渠道就出現了擁堵,用戶熱情是足夠的,『這也就意味著當前OpenAI實際上沒有商用落地的憂慮,這款產品已經可以實現變現』。
不過,微軟方面宣佈,目前全新必應預覽版中已經搭載了定制版本的GPT-4。
『如果您在過去五周內的任何時間使用過新的必應預覽版,那麼您已經體驗過這個強大模型的早期版本』
此前,微軟已經將ChatGPT整合進雲平臺Azure Open AI 中,企業和個人開發者均可借助Azure。
『微軟有望在產業中通過GPT-4不斷拓展下遊新興領域,應用於更多的場景中,並利用其多模態模型成本改變傳統AI客制化與定制化的特點,逐步向通用化方向發展』華鑫證券計算機研究團隊分析稱。
不可忽略的是,成本依然是一個掣肘。
根據中信研報測算,ChatGPT生成一條信息的成本在1.3美分左右,是目前傳統搜索引擎的3-4倍,成本問題中短期內或隻能等待硬件成本的繼續下降。
AI的『iPhone時刻』
此前有業內觀點認為,GPT-4的發佈有望成為生成式AI向超級AI快速演變的關鍵節點,而此次GPT-4真正亮相後,也引爆了業內討論。
美國銀行戰略分析師預測,人工智能正邁入『iPhone時刻』,預估到2030年會為全球經濟帶來15.7萬億美元的增長。
正如iPhone帶來的智能手機變革,GPT模型的出現又將影響未來AI領域的發展方向。
一片藍海面前,國內外創業公司和互聯網大廠都在迅速跟進,不願成為新技術掉隊者。
在OpenAI發佈會前幾個小時,谷歌剛剛宣佈推出一系列生成式AI功能,用於其各種辦公軟件中,包括谷歌Gmail、Docs《文檔》、Sheets《表格》和 Slides《幻燈片》。
在外界看來,這是谷歌意圖搶在微軟3月16日預期官宣GPT接入Office之前,展現自己的成果。
作為直接競爭對手,谷歌已走在『對抗』微軟與OpenAI的最前列。
在國內,BAT等大廠也在摩拳擦掌。
3月16日,百度將正式發佈『中國版ChatGPT』文心一言。
在王興、王慧文再度攜手、開啟AI領域創業的同時,快手前AI核心人物李巖也投身『多模態大模型』創業。
郭濤認為,ChatGPT主要基於英文環境訓練,中文語料庫內容還較少,對中文的語言特點和文化背景理解程度不夠,短期來看在中國市場競爭優勢並不十分明顯。
另外面臨的合規監管風險也較大;而百度文心一言等本土化的AI大模型,優勢在於其對中文的語言特點和文化背景的深入理解和適應,更適合中文和中國市場。
郭濤進一步表示,隨著國外巨頭基於智能對話機器人應用產品或服務快速進入中國市場,以及百度、阿裡巴巴等國內企業相關產品的相繼問世及日趨成熟,智能對話機器人市場競爭將空前加劇,缺乏生態體系支撐的企業或將最先被淘汰出局,競爭方式也將從技術競爭轉向品牌、價格和服務等綜合實力的競爭。
如今,兵家必爭的不隻是當前的市場,還有未來AI時代的定義標準與話語權。
正如英偉達CEO黃仁勛表示,『你知道你今天做不到,但是當然,它總有一天會做到的』。
北京商報記者 方彬楠 趙天舒 實習記者 李想
實測
北京商報記者分別向GPT-4和ChatGPT-3.5輸入『幫我出一個北京一日遊的攻略』,發現GPT-4相較於舊版本更加具備規范和精確的語言能力,同時也具備更精確的知識。
GPT-4的行程可以精確到以小時計算,遊覽路線也更為具體。
● ChatGPT-3.5:
好的,以下是一個北京一日遊的攻略:
早上可以先去天安門廣場,欣賞一下國家升旗儀式。
不過要注意的是,這個活動時間比較早,一般在早晨6點左右開始,所以需要提前安排好時間。
接著可以前往故宮博物院,遊覽一下這個中國最著名的古建築群。
建議提前預訂門票,以免浪費時間排隊。
中午可以到王府井大街附近的小吃攤或者餐館嘗嘗北京特色美食,如烤鴨、炸醬面、豆汁等。
下午可以前往頤和園遊玩,頤和園是中國古代皇家園林之一,被譽為『萬園之園』,是北京市最大的皇家園林。
在這裡,你可以欣賞到各種精美的古建築和風景,同時也可以了解一些有趣的歷史故事。
晚上可以到三裡屯或後海一帶逛逛,感受一下北京夜生活的熱鬧氛圍。
這裡有各種灑吧、餐廳、小吃攤等,可以滿足你的各種需求。
以上就是一個北京一日遊的攻略,當然如果你時間充足,建議多留幾天,體驗更多北京的文化和歷史風情。
● GPT-4:
當然可以!這裡是一個建議的北京一日遊攻略。
請注意,這個行程比較緊湊,如果您想更加深入了解某個景點,請相應調整時間。
天安門廣場《06:30-07:30》
早上6:30左右,您可以在天安門廣場觀看升國旗儀式。
天安門廣場是世界上最大的城市廣場,是中國政治和文化的象征。
故宮博物院《07:45-11:00》
從天安門廣場步行到故宮博物院,遊覽中國古代皇家宮殿。
建議提前在線購票,以避免排隊等候,遊覽時間可能較長,因為故宮博物院規模龐大且景點眾多。
王府井大街《11:30-13:00》
乘坐地鐵前往王府井大街,這裡有許多購物商場和特色小吃。
您可以在此品嘗北京烤鴨、炸醬面等北京美食。
天壇公園《13:30-15:30》
參觀天壇公園,遊覽祈年殿、皇穹宇和回音壁等歷史建築。
天壇是古代皇帝祭祀祈福的地方,也是中國最重要的皇家祭祀建築群之一。
南鑼鼓巷《16:00-17:30》
漫步南鑼鼓巷,欣賞北京傳統胡同的風貌。
您可以在此品嘗各種特色小吃、購買工藝品或參觀胡同文化展覽館。
鳥巢與水立方《18:00-19:00》
參觀2008年北京奧運會的標志性建築:鳥巢《國家體育場》和水立方《國家遊泳中心》。
在這裡您可以拍照留念。
什剎海地區《19:30-21:30》
晚上,您可以去什剎海地區品嘗美食、逛酒吧或聽聽現場音樂表演。
這裡是北京著名的夜生活區域,也是感受傳統與現代交融的好地方。