AIが画像を生み出す驚異のテクノロジー「GAN」。まもなく「透視メガネ」も実現!? | 未来塵

AIが画像を生み出す驚異のテクノロジー「GAN」。まもなく「透視メガネ」も実現!?

GAN-ARメガネイメージ

1970年代のマンガや雑誌によく掲載されていた怪しげな通販カタログの広告。

その中に少年心をくすぐる「透視メガネ」「X線メガネ」というアイテムがあった。

しかし実際の機能は・・・期待して買った少年たちの希望を見事に打ち砕くお粗末なものだった。

ドラえもんにも「とうしめがね」という「ひみつ道具」が登場する。

見た目は虫眼鏡だが、このレンズを通して向こう側を見ると、壁などの障害物を透かして見ることができる。

もちろん衣服なども・・・ということで悪用厳禁だが、この技術を実現するのは相当ハードルが高いだろうなと思っていた。

しかし最近のAI(人工知能)の進化は、世の男性の密かな願望をかなえてしまうかもしれない。


AIの進化を加速させてきたのがディープ・ラーニング(機械学習)だが、その中でも最近注目されている「GAN」という技術がある。

※「GAN」(ギャン)と読む。

「GAN」とは「Generative Adversarial Networks」の略で、日本語では「敵対的生成ネットワーク」(wiki)と訳される。

「敵対的」とはAIが反乱を起こしそうなイメージでなんだか怖いが、「Generator」と呼ばれる生成AIが生み出したデータを「Discriminator」と呼ばれる識別AIが本物か偽物か判別する技術だ。

たとえば生成AIが生み出したお札の画像を識別AIが偽札かどうか判別するとしよう。
生成AI識別AIにケチをつけられないように正確なお札の画像を作ろうとし、識別AI生成AIのお札のミスを発見してやろうと互いに競争しながら学習していく。

「GAN」は正解のデータを人間が与えることなくAIだけで学習していく「教師なし学習」なので、その進化のスピードは驚異的だ。

たとえば次の女性は実際には存在しない人物で、AIが生み出した画像だ。

AIが生成した架空の女性
ThisPersonDoesNotExist.comより

百聞は一見にしかず、こちらのサイト「ThisPersonDoesNotExist.com」にアクセスしてほしい。
ページをリロード(更新)すると次々にさまざまな年齢・性別の顔が表示されるが、彼らはすべてAIが生み出した架空の人物であり、誰一人として実在しない。


リアルな人間よりは2次元の方がいいという方にはこちらの「ThisWaifuDoesNotExist.net」をどうぞ。

AIが生成したアニメの女の子
ThisWaifuDoesNotExist.netより

このサイトも下の方にある「REFRESH」ボタンで画像が次々に切り替わる。ほうっておくと自動で切り替わってしまうので、お気に入りの画像があれば「PAUSE REFRESH」を押して保存した方がいい。
注目したいのはときどき崩れたような画像が表示されることで、AIが画像を生成している実感がリアルに伝わってくる。


人間には興味ないという方にはこちらのネコ版「TheseCatsDonotExist.com」をどうぞ。

AIが生成したネコたちの画像
TheseCatsDonotExist.comより

よく見ると、たまにホラーなネコの画像も生成されている・・・。


実在しない全身の人物画像を生み出す「全身モデル自動生成AI」もある。

全身モデルをAIが自動生成
データグリッド社のYouTubeより

このGANは京都に本社を置く「データグリッド」が開発中だ。


パンツからスカートへ着せ替えなど、画像の中の内の特定領域をより自然に変換させる「InstaGAN」というGANも研究されている。

パンツからスカートへ着せ替え画像
InstaGAN: Instance-aware Image-to-Image Translationより


そしてついに、1枚の写真から「おしゃべりする顔」まで生成できるようになった。

サムスン電子のモスクワAIセンターに所属するイゴール・ザカロフ博士たちは、膨大なデータを使って顔の特徴を認識する技術GAN技術を組み合わせ、たった1枚の写真から表情豊かに会話する顔の動画を生み出す技術を開発した。

これは「Realistic Neural Talking Head Models」(リアルなニューラル・トーキングヘッドモデル)と呼ばれている。

AIが生成した「おしゃべりするモナリザ」の画像
「おしゃべりするモナリザ」Egor ZakharovのYoutubeより

1枚のモナリザの絵から、こんな豊かな表情が生み出せるとは驚きだ。


「全身モデル自動生成AI」「InstaGAN」「トーキングヘッドモデル」を組み合わせてさらに進化させれば、取り込んだ現実世界の人物の画像をリアルタイムで加工して、メガネなどのモニターに出力する「透視メガネ」が完成できそうだ。


「透視」だけでなく「AR(拡張現実)」に応用すれば、歩いている人の衣装を奇抜なデザイナーズファッションに変えたり、飛んでいる鳥をプテラノドンに、動物園の像をマンモスに、ライオンをケルベロスに変身させて、ただメガネをかけて散歩するだけでファンタジーな世界を体験できる。

ただし最後に大事なことを1つ。

「ほんやくコンニャク」→「Google 翻訳」「インスタントテレビ局」→「YouTube」など、ドラえもん「ひみつ道具」が少しずつ現実になっているが、のび太がドラえもんの忠告を無視していつも失敗するように、最新のテクノロジーの使い方には細心の注意が必要だ。


References: 「流行りの画像生成技術GANを調査し、役に立つシナリオがないか考えてみる」(tomohiku氏の「Qiita」2019/4/26より)