訂閱
糾錯
加入自媒體

今天,你“文生圖”了嗎?

2022-11-25 10:09
知頓
關(guān)注

最近一段時間,“文生圖”異;鸨,或者叫AI繪畫、AI作畫,其實叫什么不重要的,重要的是本質(zhì),就是這一新技術(shù)究竟會給社會帶來怎樣的影響或顛覆。

隨著一幅幅精美的“文生圖”繪畫作品出現(xiàn)在網(wǎng)絡空間,抖音開始出現(xiàn)各種教授網(wǎng)友制作文生圖的視頻教程,而在小紅書和閑魚上甚至還出現(xiàn)了賣AI壁紙、AI文生圖描述語句的職業(yè)。

簡單來說,文生圖,就是輸入一些描述語句,AI可以為你生成創(chuàng)意畫作,這是當下AI最火熱的應用領(lǐng)域之一——AI作畫。其實也是AIGC的一種。最近幾年,AI寫作、AI作曲,AI在內(nèi)容創(chuàng)作方面的應用可謂越來越廣泛了。

今天,你“文生圖”了嗎?

對于“文生圖”這樣一個新事物,無論是百度、谷歌這樣的互聯(lián)網(wǎng)大廠,還是新銳創(chuàng)業(yè)公司都已入局。

最近,百度旗下的AI藝術(shù)和創(chuàng)意輔助平臺——文心一格的發(fā)布引起比較大的關(guān)注。畢竟以人工智能技術(shù)驅(qū)動發(fā)展的百度,此前已經(jīng)在搜索引擎、自動駕駛、數(shù)字人、AI語音交互等領(lǐng)域取得了不俗的成績,在AI作畫領(lǐng)域,百度的“文心一格”也備受期待!

文生圖作畫效果怎么樣?

文生圖效果好不好,先來上一組圖,大家自己看。

今天,你“文生圖”了嗎?

我也親測了一下,整體效果還不錯!

比如輸入“晴朗夏日竹林里的少年”,生成了這樣一幅圖!

今天,你“文生圖”了嗎?

基本符合預期。

輸入“古風美男,長發(fā)飄飄”,選擇動漫風格。就出現(xiàn)了下面這張圖。

今天,你“文生圖”了嗎?

用這張圖片用來給一篇分析二次元、國漫方面話題的文章配圖肯定是ok的。

今天,你“文生圖”了嗎?

輸入“深秋,陽光下的小女孩”;究捎。當然也有不足的地方。比如手部細節(jié)不夠完美。這幾乎是目前所有“文生圖”平臺的通病,就是臉部細節(jié)和手部細節(jié)的呈現(xiàn)不夠完美。需要平臺提供就文生圖畫作局部調(diào)整的功能。比如圈定要修改區(qū)域,輸入描述,然后進一步優(yōu)化,就能輸出調(diào)整后的結(jié)果。估計,這將是“文心一格”下一步要上線的功能。

再輸入“深秋一位打太極拳男子的背影”,出來的圖片,背影不完整。

然后輸入“天空中的一條龍”,出來的龍并不是我想要的中國龍,重新調(diào)整詞匯,輸入“云層中一條咆哮的中國龍”就得到了想要的結(jié)果。

嘗試下來,整體感覺,輸入一句話比輸入幾個詞匯結(jié)果更令人滿意,描述字句越詳細,畫面細節(jié)也越豐富。

時間方面,“文心一格”顯示“請等待2分鐘”,但是通常是幾十秒,就能得到四種結(jié)果,供用戶選擇。

之前使用過Stable Diffusion的AI做圖,由于只支持英文交互,所以對于英文一般的我而言,還是比較限制表達。雖然現(xiàn)在有各種翻譯軟件,但是還是比較麻煩。百度的“文心一格”無疑更適合中國用戶。

不難看出,“文生圖”技術(shù),對中文語義的理解尤為關(guān)鍵。對于設計師而言,能準確理解客戶需求就能交付好的作品讓客戶滿意。對于AI作畫同樣存在這個問題。這一點“文心一格”還是比較優(yōu)秀的。

比如輸入“草原上奔跑的寶馬”,究竟是什么馬?究竟是汽車寶馬,還是一匹駿馬?輸入“佛跳墻”會出現(xiàn)什么樣的內(nèi)容?是一尊佛從墻上跳下來,還是佛跳墻這道菜?對比一下文心一格與其他文生圖平臺的結(jié)果,“文心一格”顯然對中國文化的理解更精準。

今天,你“文生圖”了嗎?

如何做到對需求的準確理解?

在我看來,對需求的準確理解,應該是“文生圖”這項技術(shù)最重要的能力。那么,如何做好這一點?

百度技術(shù)中臺事業(yè)群市場部負責人張全文提到了一個關(guān)鍵詞——大模型。

張全文介紹:“文心一格”“AI作圖”產(chǎn)品順利落地,是百度依托于飛槳、文心大模型持續(xù)進行技術(shù)創(chuàng)新的結(jié)果。百度的文心跨模態(tài)大模型ERNIE-ViLG 2.0是全球首個知識增強的AI作畫大模型,也是目前全球參數(shù)規(guī)模最大的AI作畫大模型。近年來以深度學習為代表的算法發(fā)展,以及數(shù)據(jù)量井噴式增長,讓百度在訓練大模型方面取得了長足的進步。

所謂大模型,就是讓算法在大規(guī)模、海量的、沒有標注的、無規(guī)律的數(shù)據(jù)里面進行自我學習,挖掘規(guī)律,進而生成一個基礎的模型。之后在這個基礎的模型之上,結(jié)合各個領(lǐng)域的少量的任務數(shù)據(jù),再進行訓練、調(diào)優(yōu),之后就可以適用很多場景。

今年7月,百度用大模型復原了元代畫家黃公望的傳世畫作《富春山居圖》。這幅畫作在之前被火焚燒,分成了兩段,2011年前后半卷首次在臺北故宮博物院展出。百度的工程師,運用AI大模型技術(shù)去學習原畫做的筆觸和風格,并邀請普通用戶借助百度的技術(shù),按照心中所想來補全該畫作。不同的人呈現(xiàn)出不同的《富春山居圖》,每一幅畫作卻都那么和諧,不禁令人驚嘆AI技術(shù)之妙用。

在科技想象力不斷破圈的今天,AI作畫正處在高速發(fā)展的黃金階段。相信,不久之后這項能力就會成為用戶日常獲得圖像內(nèi)容的基礎選項,完全融入我們的生活與工作之中。

除了AI作畫之外,文心大模型投入產(chǎn)業(yè)應用,服務千行百業(yè)的節(jié)奏應該也是非?斓摹

據(jù)張全文介紹,文心大模型具有兩大核心特色,一是知識增強,二是產(chǎn)業(yè)級。得益于兩大特色,文心大模型通用性好、泛化性強,作為人工智能“基礎設施”的一部分,進一步拓寬了人工智能技術(shù)落地的場景覆蓋廣度,更加深了產(chǎn)業(yè)應用的深度。

目前,文心大模型已大規(guī)模應用于搜索、信息流、智能音箱等互聯(lián)網(wǎng)產(chǎn)品,并已通過飛槳開源開放平臺、百度智能云等賦能到工業(yè)、能源、金融、通信、媒體、教育等各行各業(yè)。

幫助有圖片需求的人“降本增效”

有了文生圖以后,作為從事自媒體工作的我來說,還是非常開心的。畢竟對于自媒體創(chuàng)業(yè)者來說,只要能“降本增效”的技術(shù)都是要積極擁抱的。

此前為了節(jié)省圖片制作成本,嘗試過各種大小網(wǎng)站,海報制作,AI摳圖,照片轉(zhuǎn)漫畫等等。本著節(jié)約設計費的角度,能省一張是一張。幾年下來,充值了五六個網(wǎng)站,也沒能很好的解決這個問題。仍然需要人工設計來完成公眾號封面制圖工作。文章內(nèi)的配圖,則是盡量少配圖,甚至不配圖,避免侵權(quán)問題。

熟悉知頓公號的朋友到知道,我們在一番嘗試之后,將公號圖片風格確定為漫畫風格,目前是真人畫師手繪。好處是有顏值,有識別度,有一致的風格,有自己的版權(quán)。付出的代價是按照數(shù)量付費,用得越多,成本越高。

文生圖技術(shù)的出現(xiàn),確實可以部分替代封面圖設計制作問題。如果能定制風格,或者輸入?yún)⒖硷L格的圖片,那么這個替代作用會更好用。

目前“文心一格”還處于免費階段,即使日后收費,大概率也是按照會員收費,整體成本還是要大大低于設計費用。

估計該技術(shù)將在設計、繪畫領(lǐng)域率先落地,特別是影視、動漫、游戲、漫畫、媒體、廣告、出版、時尚、媒體等行業(yè),大面積商業(yè)化指日可待。

文生圖會取代人類畫師嗎?

這么一來,可能很多人要擔心:“設計師、畫師是不是要下崗了!”其實,這個擔心不無道理,但是歷史的車輪永遠向前滾動,新技術(shù)的對傳統(tǒng)領(lǐng)域的解構(gòu)和重塑一直都在發(fā)生。

短期來看,文生圖是AI輔助創(chuàng)作,還是很難代替設計師、畫師的。畢竟真實世界的需求,很多是目前AI技術(shù)無法精準理解和實現(xiàn)的。積極的一面是,設計師、畫師可以借助AI,提高自己創(chuàng)作的效率,甚至激發(fā)無窮的想象力。畢竟AI從海量數(shù)據(jù)中學習到的知識,是靈感得以實現(xiàn)的基礎,人類畫作數(shù)千年的積累和沉淀為AI文生圖提供了可能;AI生成圖像過程中的隨機性,是靈感的補充,AI可以學習一千種人類繪制山峰的方式,甚至創(chuàng)造出“第一千零一種可能”。

但是,也必須承認,AI作畫確實會給一部分缺少創(chuàng)意能力,設計和繪畫水平一般的人帶來沖擊。

回顧人類發(fā)展歷史,新技術(shù)的出現(xiàn),改變了很多行業(yè)。比如電腦的普及和輸入法的出現(xiàn),讓打字員這個職業(yè)迅速消失。其實,一些職業(yè)的消失也并不是壞事。比如中國古代每個女人都是要學習針織刺繡這樣的女工手藝,以滿足一家老小的穿衣需求。即使在我小的時候,冬天穿的棉衣褲、春秋穿的毛衣毛褲也都是母親手工制作。那時候有“裁縫”這個專門的職業(yè),而如今裁縫這個職業(yè)基本消失了,卻出現(xiàn)了服裝設計師。精細化的分工,讓服裝實現(xiàn)了工業(yè)化生產(chǎn)和流通,人們隨處都可以買到服裝。

當技術(shù)浪潮來臨之際,做弄潮者,還是被拍死在沙灘上,答案不言而喻。作為繪畫創(chuàng)作者,主動去擁抱“文生圖”這樣的新技術(shù)或許是最好的選擇。正如人工智能專家吳軍說過的那樣,“任何一次技術(shù)革命,最初受益的都是發(fā)展它、使用它的人,而遠離它、拒絕接受它的人,在很長的時間里都將是迷茫的一代。”

點燃普通人的繪畫創(chuàng)作熱情

不同于設計師和畫師,AI作畫那么對于普通用戶又意味著什么?

在我看來,更多的是點燃了普通人的創(chuàng)作熱情!

舉個例子:一位爸爸,通過文心一格,給女兒做了一個繪本。講述了他和妻子從學生時代相識、相愛,到結(jié)婚,以及妻子懷孕,給女兒布置房間,女兒長大成為一名小學生的過程。不懂繪畫的爸爸,通過AI繪畫的方式,配上自己充滿愛的語言,給孩子親手制作這樣獨特的記憶繪本。

今天,你“文生圖”了嗎?

今天,你“文生圖”了嗎?

繪畫是一個需要長期培養(yǎng),投入一定時間的技能。每個人小時候或多或少都有繪畫創(chuàng)作的熱情,但是,這種熱情往往在漫長的技法學習與練習中被逐漸磨滅,能堅持下來的畢竟是少數(shù)。AI繪畫可以讓沒有繪畫基礎的普通人,點燃創(chuàng)作熱情,實現(xiàn)創(chuàng)作自由。

當技術(shù)降低創(chuàng)作的門檻,就會使得這一領(lǐng)域迅速繁榮起來,就如同生物界的“涌現(xiàn)”。在AI繪畫領(lǐng)域也一定會出現(xiàn)這樣的“涌現(xiàn)”情況,這大概是這項技術(shù)給普通人帶來的新機會。

關(guān)于AIGC的發(fā)展趨勢,百度CEO李彥宏曾表示,未來AIGC將走過三個發(fā)展階段:“助手階段、協(xié)作階段、原創(chuàng)階段。在第一階段,AIGC將輔助人類進行內(nèi)容生產(chǎn);第二階段,AIGC以虛實并存的虛擬人形態(tài)出現(xiàn),形成人機共生的局面;第三階段則是原創(chuàng)階段AIGC將獨立完成內(nèi)容創(chuàng)作!憋@然當前我們還處于第一階段!半S著技術(shù)的突破,AI作畫,AI創(chuàng)作視頻,甚至構(gòu)建整個虛擬世界可能變得像手機拍照一樣簡單!睂τ贏I繪畫,我們可以有更多的期待!

如何避免技術(shù)作惡?

每一次新技術(shù)誕生之后,人們總是免不了擔憂。“文生圖”技術(shù)是否會也被濫用,坦白說,很難完全避免。

比如輸入倒在血泊中的一匹馬,可能平臺會提示,請修改輸入語句。但是將語句調(diào)整為,一匹馬倒在紅色的湖泊中,AI就能自動生成圖片了。這方面就需要平臺對搜索詞匯進行甄別了。我們有理由相信,有著20年搜索引擎經(jīng)驗的百度,無疑會比其他公司做得更好一些。困難雖然多,但是總會找到解決的方法,不至于因噎廢食。

百度董事長兼首席執(zhí)行官李彥宏曾提出人工智能倫理的四原則,即 AI 的最高原則是安全可控;AI 的創(chuàng)新愿景是促進人類更平等地獲取技術(shù)和能力;AI 的存在價值是教人學習,讓人成長,而非超越人、代替人;AI 的終極理想是為人類帶來更多自由與可能。

“這是技術(shù)可以有所作為,也應當有所作為的方向”深以為然十分認同。ㄎ / 知頓 書華 )

       原文標題 : 今天,你“文生圖”了嗎?

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號