人工智能AI生成的藝術:從文本到圖像、視頻、3D建模。

人工智能AI生成的藝術:從文本到圖像、視頻、3D建模。

繼去年火遍全網的虛擬人之後,AI繪畫又成了今年熱議的科技話題。

AI繪畫就是「以文生圖」, 打通了文字和圖像的隔閡,只要輸入一段文字描述,AI 就可以把用戶腦海中想象的畫面呈現出來。

這是一種文字轉圖像《Text-to-image》特性的嶄新交互方式,使用文字描述,或者基於畫面意象和故事,或者基於藝術家風格、構圖、色彩、透視方法等專業名詞,就能在數十秒內生成完整的繪畫作品,人人都能成為藝術家。

例如這種:

除了國畫、風景畫,二次元也不在話下。

簡單來說,就是AI學會了『命題作畫』。

其實,AI繪畫早在2015年就已經出現,但隨著技術的不斷增強,人們驚奇的發現,AI作畫已經發展到了難以想象的地步。

在國內外網路上,AI作畫迅速成為焦點話題之一。

即使大眾對AI繪畫的褒貶不一,但我們不得不承認,AI生成藝術的爆發大勢不可逆。

作為計算機視覺算法領導者,皮卡智能AI也不甘落後。

目前也研究出「文字生成圖片」技術,正在不斷完善中,僅供商業使用,可調用定制化API接口服務。

用戶可前往官網進行案例操作,如需生成更好效果,可嘗試輸入英文關鍵詞,每個關鍵詞可隨機生成4-5次不同的圖片。

珊瑚小鎮

對於大多數普通人來說,進行AI繪畫創作無疑是新奇的體驗,隻需要輸入指定的關鍵詞,就能生成自己想要的圖片,甚至能顛覆想象生成更大膽的創作。

看似是一個傻瓜就能上手的工具,卻經歷了多年的技術突破才能實現今天的效果。

傳統AI繪畫的技術原理是生成網路《GAN》或VAE等,目前,GAN作為上一代AI 繪畫工具與平臺最主流的圖像生成模型,在模型訓練方面已經有了很大的突破,但在實際應用的過程中仍然擁有嚴重的結構性問題。

采用 Diffusion Model 的 Dall-E-2 生成的圖片

而AI生成藝術爆發背後主要的技術原因是 Diffusion Model (擴散模型) 在這 2 年的發展,突破了AI 生成藝術多年以來的技術瓶頸,結合已經發展得很成熟了的文本語言模型 GTP-3 ,帶來了可用性極高的文本生成圖片工具。

把原圖用馬爾科夫鏈將噪點不斷地添加到其中,最終成為一個隨機噪聲圖像,然後讓訓練神經網路把此過程逆轉過來,從隨機噪聲圖像逐漸還原成原圖,這樣神經網路就有了可以說是從無到有生成圖片的能力。

而文本生成圖片就是把描述文本處理後當做噪聲不斷添加到原圖中,這樣就可以讓神經網路從文本生成圖片。

在現階段,對於藝術、影視、廣告、建築、時尚、新媒體等創意行業從業者來說,AI繪畫的崛起其實是有很多幫助的,它可以作為一個強大的助手,輔助日常工作,提高產出效率,降低時間和經濟成本,以下列舉了一些AI繪畫的應用方向。

To C的生產工具

這種最直接的應用場景主要展現在修圖APP、to設計師端的站酷、即時設計等生產工具,AI繪畫可以為這些產品增加場景豐富度,提高用戶粘性。

為藝術解放生產力

這種應用場景大概率會出現在插畫師、動畫師、電影創作者等實現能力補充,解放生產力。

這其中應用最多的企業可能會是廣告公司、影視創作公司、建築事務所等對藝術效果圖有大量需求的企業客戶,單是這幾類企業就有不低的市場天花板,另外,品牌商家的廣告和創意部門也是有力的受眾之一。

AI生成的這就是街舞5·李承鉉隊長大秀背景

實現『創作自由』

在當下全民自媒體、低門檻內容制作的時代,AI繪畫也會在此領域發光發熱,就拿B站的二創來說,越來越多的up主利用AI來進行創作輸出,分享更多更有趣的AI技術。

基於這一點考慮,國內主要內容生產分發的平臺、電商平臺、互聯網大廠等都有可能會先後在自有產品生態中孵化AI繪畫功能,幫助用戶快速生成符合平臺調性的藝術內容,同時服務自己的用戶和企業用戶。

科技正在慢慢改變世界,AI「以文生圖」僅僅是AI生成藝術的冰山一角,未來還會嶄露出更多AI生成藝術。

例如AI生成視頻,既然AI可以生成圖片,那生成視頻自然將會成為下一個待開墾的地帶;視頻有了,AI生成3D模型也指日可待。

AI時代的內容領域,創作者們總要不同程度地與AI對壘。

這難免帶來沖擊和焦慮,但我們也應該知曉,它們終究隻是工具,不能淘汰人類的想象與創造。