ChatGPT 橫空出世,在全球科技圈掀起一場巨浪,隨之而來的是無數蜂擁而至的『掘金者』。
而在全球為 ChatGPT『狂飆』的背後,是單樣本學習 NLP 技術在質疑聲中,超過 7 年的技術深耕。
01.一條飽受爭議的創新之路
早在 2015 年,機器和語言的關系還相當陌生,相比於數字、聲音、圖片等其他數據類型,語言是計算機最不擅長理解的數據,它們的關系完全沒有今天這般火熱。
計算機對語言的理解極度局限於非常狹窄的問題空間《如情感分析,語法分解等》。
每一個具體的問題都需要大量的數據標註《俗稱監督學習》,以google,Facebook 為代表的大量科技公司投身於大數據解決方案的行列。
也造就了一批類似於Scale.ai的數據標註平臺成為獨角獸。
然而矽谷有一家公司,選擇了完全相反的技術方向,他們相信計算機對語言理解的終極算法,應該是建立更高維度的語義代表《semantic representation》,通過訓練擁有高維度語義理解的神經網路模型,再通過零樣本或單樣本數據向低維空間投影以解決人類理解內的各類問題,達到觸類旁通的效果。
這家公司,就是Brain.ai。
2016 年,Brain 推出了美國工業界首個單樣本學習的自然語言處理模型和世界上第一個可以執行多 App、多步任務的人工智能應用。
並在業界和學術會議大量推廣 SRL 技術和以它為代表的單樣本學習方向。
同年,Brain得到了喬佈斯家族的投資,成為了喬佈斯家族唯一投資的科技公司。
『簡單地講,監督學習類似於嬰兒的學習方法《沒有先驗經驗》而單樣本學習類似於成人學習的過程《擁有先驗經驗》』
Jerry 給我們解釋道 『嬰兒在學習的過程中需要大量的標註數據,比如媽媽需要給孩子重復非常多遍‘這是一個門’,嬰兒才可以學會這個詞和它所對應的含義。
而當一個成年人聽到‘門沒關’時,‘門’這個字則是對應到一個抽象的對應著之前見過的每一扇門的概念。
這也就是為什麼成人可以通過幾句話和極少的數據得到快速的學習,甚至認知提升。
我們在業界推出的擁有觸類旁通能力的單樣本學習 NLP,就是通過閱讀幾乎全人類數據並建立語義代表的方式讓大模型獲得先驗經驗的』
早在 2016 年,Jerry 就在用同樣他認為最簡單的方式解釋他們的技術方向,但在和很多機構投資人溝通的過程中,Jerry 在技術方向上得到了非常多的質疑聲。
VC 們問過最多的問題就是:『如果單樣本學習是自然語言處理 NLP 正確的方向,為什麼google每年將數十億美金投入在完全相反的科研方向?』
直到2017-19 年的幾個重大技術突破,Brain在業界率先在產品中先後使用 BERT 和 Transformer 作為語義代表,以及以單樣本學習為基礎的 GPT 模型在 2020 年的問世,行業和學界才逐漸轉變態度,開始正視這項技術。
截止 2022年 3 月,Brain 單樣本學習 NLP 模型月訪問量破千萬,創造的單日收入首次突破 30萬美金大關。
02.簡化AI成為通用語言—通用AI賦能每個行業
然而作為 Jerry 在 23 歲創立的第三家公司,Brain 的目標不再是簡單地成為 Jerry 創立的又一家獨角獸。
他相信簡單易用的通用 AI 界面是一種每個人都應該享有的權利。
它是未來的教育,是人和人類文明的連接,是一種全新的思考語言,也是加速人類進化的最有效的方式。
這個世界很不公平。
在未來在以日為單位極速變革時代,未來世界的大部分價值將隻被極少數人創造。
目前世界上隻有 0.33% 的人會寫代碼,其中不足 5% 的人是機器學習工程師《美國平均年薪 18 萬美金》。
而這萬分之一的機器學習工程師中又隻有極少數人深入理解自然語言模型或者單樣本學習模型的前沿架構。
在 2019 年 Brain 推出第一代 Multimodal Interface Transformer-1 《多模態界面Transformer-1》之後,Jerry 意識到這個通用模型不僅僅會顛覆每一個行業,而且也許可以徹底改變這種不公平的局面。
因為代碼是對機器友好的語言,而界面是對人類友好的語言。
而多模態界面 Transformer包含了對二者的深度理解,在該模型通過使用自己的自我迭代和強化學習中,找到了人機交互的終極答案:使用即創造—-MIT-2 誕生了。
2022 年,Brain.ai 推出了基於第二代多模態模型 Multimodal Interface Transformer-2 的 AI 交互界面及開發平臺 Imagica。
在該平臺上使用即創造,不需要學習代碼,不需要理解如何重訓練或fine-tune模型,在你表達想法的同時,相應的界面就會被創造出來,如果界面中存在智慧功能,模型也會通過簡單的應用描述自我 fine-tune 到特定的低維空間以支撐界面的智慧部分渲染。
創造應用不再受限於結構化的數據和大量的 API 規則,想象即創造。
從此,每個人都可以通過極其簡單的交互界面使用和創造任何 AI 為自己所用,甚至在無代碼的情況下導出成可供他人使用的應用。
至今為止,在內測用戶中,已經有大量成功的案例,比如,有大律所的律師將公司法應用場景和專業流程快速導出成一個自我訓練的高準確度『過去案例分析 AI』和『案件文檔整理 AI』供客戶和律所內部使用;也有金融行業基金經理創建的AI 通過分析新聞及股票走勢創建倉位建議並自動生成投資界面供散戶投資者直接使用;更有老師將課程內容和知識點上傳後自動導出成『通用課程講解 AI』以及『學習文檔、學習視頻生成 AI』供其學生使用等等。
目前開發者最小年齡為 14 歲,其花費 1 小時建立的遊戲人物生成 AI SaaS 應用在兩個月內日營業額過萬;也有 16 歲的中學生在通過 Imagica 無縫使用 Alphafold 模型生成蛋白質折疊結構預測,使用和最前沿科學家同樣的工具進行癌症研究。
當 AI 的使用和學習成本降低至幾乎為零,每個人都可以最大化發揮他們的潛力。
『我們兒時都會有很多天馬行空的想象,希望通過這些想法可以產生對世界的價值,但大多數時候我們會被告知需要做好準備,才可以按部就班地影響世界。
Imagica 就是對這個status quo《現狀》以及成人世界的反抗,我最感動的事,是發佈內測的第二周看到一個從小熱愛物理的初中生通過 Imagica 一步步對人類最深層認知和自然科學的簡化與剖析,他開始用 Imagica 的為他生成的模型計算多體量子基態波函數』
『人類的所有財富都來自於從無到有的想象。
當AI可以大量降低從一個想法到它產生真實世界價值的成本和阻力,我們也許會逐漸停止用陳舊的教育系統繼續扼殺下一代的想象力;當每個人、甚至孩子都能站在人類最前沿的對自然科學、經濟和社會的理解之上思考,想象力可以直接影響世界』
當談到 Imagica 的價值時,Jerry 這樣回答。
『我們可能已經忘記,人類也經歷過 90% 都是農業生產者的時代,但當機器的出現可以不再需要每個人留在農田裡也可以解決全人類溫飽的時候,我們就不應該繼續教育所有下一代如何種田;以 AI 今天的發展速度,5 年後很非常多行業和甚至最前沿的崗位和研究都會被 AI 取代,創建 Imagica,簡化 AI 的使用,是我們對這種趨勢的回答』
在教育方向上,Imagica 已進入矽谷的十餘所中小學開始試點,通過簡化通用AI的界面,想象即創造會成為下一代人思考的語言。
『未來的教育,應該是培養孩子提問的能力;最好的人機共存發展模式,AI根據人類提出的問題和假想,通過模擬實驗超越時間的維度,在 10 分鐘做 100 年的實驗,驗證想法的可行與否並用自然語言解釋給人類原因。
這樣我們才可以克服自己的時間瓶頸,讓每個人都可以創造正和價值。
說起來有點難以想象,但一分鐘一個諾貝爾的時代不遠了』
2023 年,Brain.ai 將在全球正式上線 Imagica,可以確認的是,Brain 已計劃在中國尋找合作夥伴,開放其開發平臺,並招募 100 位希望顛覆行業的高影響力人群,通過 AI 的力量賦能千行百業。
通過 Imagica 創建的測試版應用『Imagine OS』也已於 2 月登陸中國 iOS 商店並開放下載。
03.「兩分鐘快到了」
關於自己正在做的事情,Jerry 曾有一個浪漫的描述:
我們就像一群站在很高的樓上親眼目睹日出的人。
因為地球傾角的原因,我們會比地面上的人提前幾分鐘看到日出。
如果你有幸成為那第一批看到日出的人,你可以嘗試快速下樓,去告訴地面上的人太陽長什麼樣子。
雖然他們還沒有看到,但你給他們證明的最好方式,就是再等兩分鐘。