在9月底于英國(guó)倫敦舉行的深度學(xué)習(xí)高峰會(huì)(Deep Learning Summit)上,DeepMind (ASPENCORE旗下ESM姐妹媒體EETT編按:該公司現(xiàn)隸屬于Google母公司Alphabet)的研究科學(xué)家Ali Eslami介紹了一個(gè)非常有趣的項(xiàng)目,名為“人工智能與創(chuàng)造力”(Artificial Intelligence and Creativity)。7vMesmc
Eslami在DeepMind的團(tuán)隊(duì)設(shè)置了一個(gè)AI代理(agent,一個(gè)會(huì)采取某種行動(dòng)的神經(jīng)網(wǎng)絡(luò)),以繪制人臉作為挑戰(zhàn),在一臺(tái)計(jì)算機(jī)安裝繪圖程序(Mypaint),讓它能試驗(yàn)各種變量,例如選擇筆刷、放置(placement)、線(xiàn)壓(line pressure)以及顏色等。該AI代理被饋入未標(biāo)記的人臉照片訓(xùn)練數(shù)據(jù)集,而結(jié)果是令人驚訝的逼真。7vMesmc
以未標(biāo)記人臉照片訓(xùn)練的AI代理所繪制出的人臉。7vMesmc
7vMesmc
(來(lái)源:DeepMind)7vMesmc
Eslami的團(tuán)隊(duì)是利用了強(qiáng)化學(xué)習(xí)(reinforcement learning)技術(shù)。今日大多數(shù)的AI系統(tǒng)是采用監(jiān)督式學(xué)習(xí)(supervised learning),所饋入的數(shù)據(jù)是以某種方式標(biāo)記過(guò)的,因此系統(tǒng)能將結(jié)果與標(biāo)準(zhǔn)答案進(jìn)行比對(duì);相反的,非監(jiān)督式學(xué)習(xí)則是饋入未標(biāo)記的訓(xùn)練數(shù)據(jù),讓系統(tǒng)嘗試以自己的方式去辨別特征。7vMesmc
強(qiáng)化學(xué)習(xí)就是某種形式的非監(jiān)督式學(xué)習(xí),在訓(xùn)練過(guò)程中,有被稱(chēng)為鑒別器(discriminator)的第二個(gè)AI代理對(duì)結(jié)果提供回饋,好讓負(fù)責(zé)創(chuàng)造的AI代理去學(xué)習(xí)。在產(chǎn)生影像的情境中,該鑒別器可能會(huì)比較產(chǎn)出的影像與訓(xùn)練數(shù)據(jù),然后針對(duì)是否能辨別出差異提供回饋,這種回饋可能是一種分?jǐn)?shù),以量化辨別所產(chǎn)生影像與訓(xùn)練數(shù)據(jù)集之間差異的困難程度。7vMesmc
7vMesmc
強(qiáng)化學(xué)習(xí)采用兩個(gè)AI代理,其一負(fù)責(zé)創(chuàng)造影像,另一個(gè)則嘗試分辨創(chuàng)造出的影像與實(shí)際數(shù)據(jù)之間像不像。7vMesmc
7vMesmc
(來(lái)源:DeepMind)7vMesmc
在DeepMind教導(dǎo)其AI系統(tǒng)如何畫(huà)圖之前,他們已經(jīng)教過(guò)該系統(tǒng)如何寫(xiě)字──去年該AI系統(tǒng)一開(kāi)始接受的訓(xùn)練是各種英文字母的手寫(xiě)字與字體的影像(采用MNIST與Omniglot數(shù)據(jù)集),而且系統(tǒng)非常成功地重現(xiàn)了那些字母。7vMesmc
DeepMind團(tuán)隊(duì)還很驚訝地發(fā)現(xiàn),若限制筆劃數(shù),所產(chǎn)出的結(jié)果就很像是人類(lèi)在匆忙中寫(xiě)出的字跡,點(diǎn)與較小的特征會(huì)連在一起;該公司團(tuán)隊(duì)還將算法與拿著畫(huà)筆的機(jī)器手臂聯(lián)機(jī),以產(chǎn)生手寫(xiě)書(shū)法。7vMesmc
一旦該AI系統(tǒng)能應(yīng)付手寫(xiě)字,Eslami的團(tuán)隊(duì)就讓系統(tǒng)升級(jí)以應(yīng)用更大的網(wǎng)絡(luò),并采用更多CPU進(jìn)行訓(xùn)練。當(dāng)采用人臉照片做為訓(xùn)練數(shù)據(jù)集,AI系統(tǒng)繪制出的畫(huà)像會(huì)變得越來(lái)越逼真,如下圖所示的繪畫(huà)過(guò)程各個(gè)階段。7vMesmc
7vMesmc
AI系統(tǒng)繪制人臉畫(huà)像的過(guò)程。7vMesmc
7vMesmc
(來(lái)源:DeepMind)7vMesmc
請(qǐng)注意,該AI系統(tǒng)并沒(méi)有被提供目標(biāo)影像,只是創(chuàng)造它認(rèn)為看起來(lái)像人臉的畫(huà)像,而且計(jì)算機(jī)并沒(méi)有看過(guò)人類(lèi)是如何繪圖,只是藉由強(qiáng)化學(xué)習(xí)的嘗試錯(cuò)誤過(guò)程去探索關(guān)于繪畫(huà)的一切。Eslami表示,這里實(shí)際上有兩個(gè)復(fù)雜的任務(wù),其一是以高精準(zhǔn)度控制筆刷,其二是管理時(shí)間, 在過(guò)程中權(quán)衡其畫(huà)像結(jié)果要看起來(lái)有多逼真。7vMesmc
接下來(lái)該團(tuán)隊(duì)所做的事情是自問(wèn):如果我們讓任務(wù)變得更困難呢?于是他們將筆劃的數(shù)量限制從1,000減少到20,而讓他們驚訝的是,該AI代理仍然能產(chǎn)生雖然更抽象、但看得出是人臉的畫(huà)像。7vMesmc
7vMesmc
不同超參數(shù)(hyperparameters)下的不同AI代理所繪制的人臉“抽象畫(huà)”樣本。7vMesmc
7vMesmc
(來(lái)源:DeepMind)7vMesmc
而Eslami表示,那些抽象畫(huà)最讓人震驚的是,該AI代理已經(jīng)能清楚辨識(shí)構(gòu)成人臉特征的重點(diǎn)──即眼睛、鼻子與嘴巴;他們?cè)菊J(rèn)為AI系統(tǒng)只能透過(guò)模仿或是以監(jiān)督式學(xué)習(xí)被教導(dǎo)這些抽象畫(huà),但強(qiáng)化學(xué)習(xí)確實(shí)也可能達(dá)成。7vMesmc
所以AI已經(jīng)成功學(xué)會(huì)畫(huà)圖了..但這是一種創(chuàng)造力嗎?或者只是隨機(jī)結(jié)果?還有這能算是藝術(shù)嗎?你可能會(huì)爭(zhēng)辯,AI代理是利用創(chuàng)造力去嘗試以不同的方法呈現(xiàn)人臉,如上面圖片中的畫(huà)像,即使它們看起來(lái)都像人臉,其中的差異性還是比相似性更多。7vMesmc
不過(guò)事實(shí)是,AI系統(tǒng)的意圖并不在于將人臉抽象到繪畫(huà)的最基本元素中,也不是要產(chǎn)生能喚起情感反應(yīng)的畫(huà)像,其目標(biāo)是在于寫(xiě)實(shí),是以畫(huà)像看起來(lái)有多么逼真來(lái)評(píng)判其成功與否。7vMesmc
此外也會(huì)有人爭(zhēng)議,AI系統(tǒng)繪制的畫(huà)像是以高水平的技巧完成,所以這代表AI是有成就的藝術(shù)家了嗎?當(dāng)訓(xùn)練過(guò)程結(jié)束,該系統(tǒng)肯定能產(chǎn)出更好的畫(huà)像,甚至學(xué)著從模糊的筆觸開(kāi)始,在最后添加更犀利的線(xiàn)條;可惜的是,今日對(duì)于何為藝術(shù)并沒(méi)有嚴(yán)格的定義,也許這個(gè)問(wèn)題的答案應(yīng)該由觀(guān)眾們來(lái)決定。7vMesmc
編譯:Judith Cheng 7vMesmc
7vMesmc
(參考原文: Can an AI Learn to Draw?,by Sally Ward-Foxton)7vMesmc
7vMesmc