ライゾマ真鍋大度らが語る、ゴッホやピカソを凌駕する人工知能×アート論

2015.11.29 03:45

クリエイター、研究者、僧侶らで語る「人工知能の現在と未来」。第8回目SENSORS SALON参加者は真鍋大度氏(Rhizomatiks Research)、松尾豊氏(東京大学 特任准教授・GCI寄付講座共同代表)、市原えつこ氏(アーティスト)、松本紹圭氏(光明寺僧侶)、そしてモデレーターに西村真里子(HEART CATCH)。舞台となったのは神谷町 光明寺。エンターテイメントから宗教まで、人工知能が変えようとしている世界の様々な事象を語り尽くした。レポート第一弾は「人工知能とクリエイティビティ」にフォーカスする。

産業、ライフスタイル、エンターテイメント...様々な領域で「人工知能」がパラダイムシフトを起こそうとしている。とりわけ、人工知能が人間の知能を超えた時点"シンギュラリティ"が近づいていると囁かれる中、「雇用が奪われるのでは?」「社会を支配されるのでは?」さらには「人類を襲うのでは?」といった悲観的な見方も広がっている。

東京大学准教授で、日本における人工知能研究の第一人者である松尾豊氏は以前のインタビューで、そうしたディストピア的なシナリオになる可能性は低く、ポジティブな実用可能性を構想したほうが建設的であるとの見方を呈示。

【左から】モデレーター・西村真里子氏(SENSORS.jp編集長、HEART CATCH)、真鍋大度氏(Rhizomatiks Research)、松本紹圭氏(光明寺僧侶)、松尾豊氏(東京大学 准教授)、市原えつこ氏(アーティスト)

今回SENSORSはインターネット寺院「彼岸寺」を運営するなど先進的な試みを行う松本紹圭僧侶に神谷町 光明寺を議論の場としてご提供いただき、松尾氏に加え、クリエイターである真鍋大度氏、市原えつこ氏というバラエティー豊かな面々で「人工知能の現在と未来」をポジティブな目線から語り合った。

第8回SENSORS SALON「人工知能の現在と未来」の対談が行われた神谷町 光明寺。

「人工知能」研究は来年で60年。1956年〜60年代の第1次ブーム、1980年代の第2次ブーム、現在は第3次ブームと言われており、機械学習の新しい手法「ディープラーニング(深層学習)」がその核心にある。(参考:松尾氏インタビュー「ディープラーニングを理解するための人工知能Sと人工知能D」)

人工知能を理解する上で、重要な概念となる「特徴量」。例えば2012年に、Googleがディープラーニングを用いることで、コンピューターが猫の画像を認識できることが話題になった。「猫の画像を認識することが、それほど難しいことなのか?」と疑問に思われる方もいるかもしれないが、人工知能研究においては高い壁であり続けてきた。現象の中から「大きさ」「角度」「色」など様々な要素を発見し、定義するのは人間にしかできなかったのである。変数さえ設定していれば、人間よりも優秀な能力を発揮することができた。

Googleのジェフ・ディーンがスタンフォード大学のアンドリュー・Y・エングと共同で発表した、コンピューターが教師なし学習で猫を画像認識したことを示す研究。(http://research.google.com/archive/unsupervised_icml2012.html

さて、ディープラーニング(深層学習)が人工知能研究のブレークスルーとされるのは、まさにそうした特徴量を自ら発見し、定義することを可能にしたことだ。今年の2月にはMicrosoftリサーチがImageNetという画像認識技術のテストでコンピューターの画像認識精度が人間を上回ったとし、さらに5月には中国のバイドゥ(百度)がGoogleを上回る誤認識率4.58%を達成。ビッグデータを扱う企業間の間で生き馬の目を抜く争いが繰り広げられている。

「特徴量の発見こそがクリエイティビティ」であるという松尾氏。となれば、労働集約型の産業のみならず、アートやデザインを生業とする人々も含む、知識産業にも人工知能は闖入していくのだろうか。

今回の対談ではクリエイターの方々に"人工知能とクリエイティビティ"についての関係を伺ってみたかったという松尾氏。

松尾:
"ディープラーニングによって人工知能がクリエイティビティを獲得し始めている"ということは言えるとは思いますが、まだまだもっと高度なクリエイティビティはたくさんあるはずです。文化的な背景や人間の感情・価値に関わるクリエイティビティはまだまだ人間にしか発揮できない分野だと個人的には考えています。

愛の歌を自動生成して再生する「Love Song Generator」や人工知能を用いたDJイベント「2045」など人工知能を使った実験的作品に取り組んできたメディアアーティストの真鍋大度氏。ライゾマティクスリサーチではGoogleが公開していたプログラムコード「Deep Dream」やドイツの研究者らが開発したDeep Dreamをさらに進化させた「A Neural Algorithm of Artistic Style」と呼ばれる葛飾北斎やゴッホらの画風に変換できる人工知能を用いた画像処理アルゴリズムをVJプレイに取り入れ、今までではありえなかった映像効果を作り出している。

ドイツの研究者らがDeep Dreamをさらに進化させた「A Neural Algorithm of Artistic Style」では、葛飾北斎やゴッホらの画風に変換できるアルゴリズムになっている。

ピカソやゴッホ、さらには葛飾北斎といった歴史的な芸術家風のタッチで『不思議の国のアリス』を描いた動画。(https://vimeo.com/139123754
Deep Stereo: : Learning to Predict New Views from the World's Imagery(https://www.youtube.com/watch?v=cizgVZ8rjKA
真鍋:
今まで3Dのモデルを作ったり、全方位画像を作るためにはたくさんの画像が必要でしたが、GoogleがやっているDeep Stereoのようにニューラルネットワークを使って複数枚の画像の中間画像を推定する技術を用いることで今までとは違った手法で画像から映像を作ることができる。私はわりとそういうのを見つけて、それ自体を先にするというよりは、例えばそれをライブで使うときに新しい表現ができるようにするということに取り組んでいます。
約8万曲の楽曲データを使い、コンピューターに韻を踏ませ、ラップを行わせた。(https://www.youtube.com/watch?v=itY4MqqGK3U

ビッグデータがマーケティングにおけるリコメンデーションに使われることが多いのに対し、過去5年の間、積極的にデータ収集をしながら作品へのアウトプットに努めてきたという真鍋氏。現在はディープラーニングを用い、ダンスパフォーマンスの振り付ける取り組みをしているという。

人工知能を積極的にメディアアートの世界で利用しているRhizomatiks Research真鍋大度氏

真鍋:
今はひたすらモーションキャプチャのデータを集めているんですが、パラメーターの調整が難しんですね。面白い踊りができたらいいのですが、なかなかうまくいきません。なので、やっていることは複雑なアルゴリズムを考えるというよりは、集めたデータをツールに入れてみて実験をしているといったところでしょうか。

松尾氏がディープラーニングの先遠くにまだまだあるというのが、関連性のないドメイン同士の関係を解釈し、構築するクリエイティビティだ。

松尾:
例えば、机というものを飛行機と見なし、コンコルドのような机というものを考えたらどうなるでしょうか。スピード感、下をむいた先端などのコンコルドの特徴を、机という文脈で考えて創造性につながるかもしれません。人の場合、飛行機、椅子、コンコルドといった記号を使いながら、目に見えないものを想起し、頭の中で操作をしています。ディープラーニングはまだまだそのレベルに達していません。社会的な風刺や今までにない感情を呼び起こすような表現というのは、文化や人間の感情・価値を汲むことのできる人間にしか当面扱えない領域なのかもしれません。

文化庁主催メディア芸術クリエイター育成支援事業に採択された「デジタル・シャーマンプロジェクト」を手がける市原えつこ氏。松尾准教授に問い掛けるシーンも多く見受けられた。

市原:
たしかに全然関係のない何かと何かを結びつけるのは人間ならではの気がします。倫理観があった上で、他の人のリアクションを予測するのもそうですし、人間にしかできないものはまだまだ残っていると思います。

試行錯誤を通じて環境に適応することのできる「強化学習」という枠組みがディープラーニングと組み合わせることにより、大幅にその可能性を向上させている。これまでは、「どういった状況で何をすればいいのか」という学習において、状況を表す際に人間が定義した特徴量を使わなければならなかったが、それをディープラーニングによる画像の特徴量を用いるのだ。例えて言えば、猫や犬が訓練の結果フリスビーをキャッチできるようになる過程だが、どちらかといえば"運動神経"のイメージに近いのだと松尾氏はいう。
対して、行動の計画や推論、プランニングを要する行動は、今の技術ではまだまだ困難が伴う。これをデザインに当てはめると、AとBの間にあるものをもモーフィングで無限に自動生成することはできても、全く異なるものを掛け合わせ新たなデザインを創造することはまだ難しいということだ。

「Adobe MAX 2015」で発表された、人工知能を用いて静止画からデザインに使われているフォント情報を解析する技術「Deep Font / Font Capture」。このニュースを聞いて市原氏は、人間のデザイナーにしかできないことは何か?ということを考えたという。

亡くなった方の痕跡をロボットに宿らせる「デジタルシャーマンプロジェクト」にて人工知能や仏教について日々調査中の市原えつこ氏

市原:
「レタッチャーや写真から何かを生成したり、人工知能解析でフォントを生成できる」という話を聞いて、人間のデザイナーにしかできないことって何だろうって思いました。人間が意図したものよりも、人工知能が作ったものの方がカッコイイことだってあり得ますよね。これからは人間が意図して作ったものと人工知能が勝手に量産していったイメージの美しさが拮抗していくのかもしれませんね。
西村:
どっちが勝つかというより、単に組み合わせかもしれないですね。ツールもどんどん増えていますよね。
真鍋:
ドローンにしてもそうですが、僕は自分が実装できる範囲のことしかあまり考えないです。本当は脳に電極を埋め込んでみたいなことも早くやりたいですが、色んな制約があって難しいですよね。脳にセンサーを埋め込めるようになったら、例えばモーションキャプチャデータと関連付けることで、モーションの新しい分類方法が生まれるかもしれません。

「ディープラーニング」によりたしかに人工知能はクリエイティビティを獲得し始めている。ただし、まだまだその効力の範囲は限定的であり、有象無象の中から思いもよらぬアイデアを創造できるのは人間の領分と言えそうだ。当面は人工知能がクリエイターを凌駕するというよりも、クリエイターの側が数あるツールを自由に活用しながら人工知能ならではのアドバンテージを引き出し、新たな表現を生み出すことが期待される。

「人工知能は悟れるのか?」光明寺 松本僧侶×東大 松尾豊 研究者対談

構成:長谷川リョー

SENSORS Senior Editor
1990年生まれ。フリーライター。これまで『週刊プレイボーイ』『GQ JAPAN』WEBなどで執筆。「BOSCA」編集長。東京大学大学院学際情報学府在籍。最近の関心領域は「人工知能」。将来の夢は馬主になることです。
Twitter:@_ryh


写真:延原優樹

最新記事