博雯 發(fā)自 凹非寺
量子位 報道 | 公眾號 QbitAI
這下真的是萬物皆可JOJO化了!
本來就神采飛揚的馬斯克,下一刻更是仿佛要直接“我不做人啦!”
世界名畫蒙娜麗莎神秘優(yōu)雅的微笑,似乎也變得JO灼了起來……
再來個同一次元的……團長你在做什么啊團長!
而上面這些效果只要打開網(wǎng)頁Demo,點擊上傳任意本地圖片就能實現(xiàn)。
這就一下子引來了大批網(wǎng)友的圍觀,不僅推特熱度800+,在線試玩的抱抱臉(Hugging Face)還排起了隊,一張照片最多要等四五分鐘。
還不僅JOJO一種風格,還有迪士尼風、英雄聯(lián)盟風……輸入任意一種風格的圖像,都可以將這種風格快速應用到新的圖片上:
看這楚楚可憐的卡姿蘭大眼睛,以及天真無邪的公主笑,我只想說……老馬,快收了神通吧!
在線JO化任意人像
看了上面的演示,是不是自己也想整一個JO化臉?
我們用開發(fā)者提供的Hugging Face和Colab來試一下。
首先是在線網(wǎng)頁版的Hugging Face,點擊左邊框中空白處就能把任意本地照片丟進去:
再點Submit,等個十幾秒……站在你面前的不是別人,而是ko no肌肉金輪大司馬噠!
這個方法點開鏈接就能即傳即玩。不過雖然簡單快捷,但偶爾還是要排隊等個幾分鐘:
所以強烈安利colab版本,向test_input文件夾中導入任意圖像,比如我們這里放入一張冰冰,然后點擊運行:
再繼續(xù)運行下面的生成模塊:
把我的冰冰女神JOJO化,這也在你的算計之中嗎GAN !
而且,colab中還提供了另一種玩法:導入一張任意風格的圖片,自己制作一個XX風格生成器。
嗯……這不得整一個提瓦特大陸版的馬斯克?
上傳一張老馬的正經(jīng)圖:
再在style_images文件夾中上傳一張原神風格的人像:
(上傳偏二次元風格的圖像可能會出現(xiàn)“找不到人臉”的情況,需要多試幾張圖)
然后進行微調(diào),等待幾分鐘,再點運行:
這個堅毅的眼神,再配上原圖里老馬的那個遠眺抱胸的姿勢,感覺下一秒就能來句天動萬象了!
通過GAN反轉(zhuǎn)獲取近似風格
那么,這種方法到底是怎么做到只參考一張圖片,就能完美學習其美術風格,再將其運用到其他圖像上呢?
我們一起來看看這個叫做JoJoGan的模型。
它主要是通過GAN反轉(zhuǎn)(inversion)來獲取近似風格的,主要工作流程分四步:
通過GAN將參考風格圖像反轉(zhuǎn)為近似的配對訓練數(shù)據(jù),得到相應的風格化的代碼;
根據(jù)風格化代碼生成真實的人臉圖像,并與參考風格圖像相匹配,形成成對的數(shù)據(jù)作為配對訓練集;
基于這些成對的訓練數(shù)據(jù),對StyleGAN進行微調(diào);
使用微調(diào)后的StyleGAN生成新的樣本。
開發(fā)者表示,這一模型非常關注零監(jiān)督下的風格細節(jié),并且在不同風格中具有良好的通用性,能夠輕松泛化到其他風格的圖像上。
從二次元到技術宅
開發(fā)者Min Jin Chong也是我們的老熟人了,之前曾經(jīng)搞過二次元老婆生成器:
Min Jin Chong本人本科畢業(yè)于美國伊利諾伊大學厄巴納-香檳分校(UIUC),后繼續(xù)留校讀博,主要研究領域為機器學習、計算機視覺和圖像生成。
此前他曾在字節(jié)實習過3個月,現(xiàn)在與兩位同校學生一起創(chuàng)立了一個叫做Style Space的時尚購物應用,允許用戶在虛擬空間中試用和購買產(chǎn)品。
而他的導師David Forsyth則是一位CV領域的大牛,曾與Jean Ponce著有計算機視覺經(jīng)典教材《Computer Vision:A Modern Approach》:
網(wǎng)站首頁 |網(wǎng)站簡介 | 關于我們 | 廣告業(yè)務 | 投稿信箱
Copyright © 2000-2020 www.sgycos.com All Rights Reserved.
中國網(wǎng)絡消費網(wǎng) 版權(quán)所有 未經(jīng)書面授權(quán) 不得復制或建立鏡像
聯(lián)系郵箱:920 891 263@qq.com