アジラだより

ディープラーニング・テクノロジー企業『アジラ』からのお知らせです

ディープラーニングによる画像認識は人間の『眼』を超えたのか

先日、渋谷dotsにて松尾豊先生(東京大学大学院 工学系研究科 特任准教授)の講演を拝聴してまいりましたので、掲題の点に絞って。

人間の眼を「超えた」とは

例えば、1000枚ある画像を、「これはコンテナ船、、これはレパード、これはキノコ、これはマダガスカルキャット・・・」と分類したとして、人間の眼(視覚野)による認識の間違いは、51枚でした。

f:id:asilla:20170422181144j:plain

出典:How Google's Image Recognition Works

 

人間の眼(視覚野)の性能である「51枚」をベンチマークとし、米国や中国のIT企業は競うように同条件でコンピュータに分類をさせました。

2011年で最優秀だったモデルによる認識の間違いは 257枚。

「なんだ、人間の眼のほうがよっぽど優れているじゃないか、安心、安心、一安心」と思ったかどうかはさておき、この時点ではコンピュータの認識モデルは、人間の眼にまったく太刀打ちできませんでした。

この状況を一変させたのがご存知、ディープラーニング

2012年に登場してからというもの、過去の記録をものすごいスピードで塗り替えていきます(※CNNの理論自体は昔からありました)。

  • 2012年・・・164
  • 2013年・・・117
  • 2014年・・・67枚 (Google)
  • 2015年1月・・・60枚 (Baidu)

【補足】ここでの「眼」は眼球のことではなく、認識を行う視覚野のことです。イメージセンサーとしての眼はもうとっくに人間の基本性能を超えていると言われています。

一気に抜き去った

2015年2月にMicrosoftが叩き出した記録は、49枚です。

人間の認識間違い51枚に対し49枚と、コンピュータの認識のほうが正確になってしまいました。

これが「人工知能が人間の眼を超えてしまった」と言われる、最も大きな事件のあらましです。松尾先生曰く「歴史的ブレイクスルー」です。

この4ヶ月後に我々アジラは創業するわけですが、このニュースを聞いてCNN(畳み込みニューラルネットワーク)による画像認識のモデリングをすぐに始めました。ビッグデータ分析の知見もあり、あまり苦労せずに最初のプロトタイプができたのですが、そのポテンシャルの高さにみんなで驚いたのを覚えています。

【補足】実際は間違えたのが何枚ではなく、エラー率として発表されていますが、ここでは分かりやすく1000枚中、何枚間違えたという表現にしてあります。

ディープラーニングを活用した認識モデルの精度はさらに進化を続けており、

  • 2015年3月にGoogleが48枚
  • 2015年12月には再びMSが36枚

と精度を高めてきています。

この先、いずれは10枚、そしていよいよ 0枚 になる時が来ると思います。

一方、人間の行う作業において、眼(認識)を使わない仕事はないと言われています。 

  • 認識の精度が人間より高く、
  • 365日24時間フルで稼働し続けても、
  • コモディティ化して廉価になっても、

文句のひとつも言わずに、粛々と働き続ける人工知能。

どういったところにどのように使われるのか?

新しい市場がどう生まれていくのか。

どのマーケットにどんなゲームチェンジャーが表れて、プレイヤーがどうなるのか。

技術屋はもちろんのこと、事業戦略を立てる企画系のビジネスパーソンにも大変興味深いテクノロジーだと思います。

ご参考まで

松尾先生の講演について、詳細はこちらでどうぞ。

画像認識が人間の目を超えた 人工知能の歴史的ブレークスルーの先に - ログミー

f:id:asilla:20170422163429j:plain

松尾先生が推奨する『眼の誕生』を新宿紀伊国屋でゲット。早く読みたい。

f:id:asilla:20170422163433j:plain

こちらもつい買ってしまいました。

途中、AI開発をなりわいとするITスタートアップの情景が描写されているのですが、「アレレ、うちとぜんぜん違うぞ。アレレレ」となりました。

ITスタートアップと云えば、一般のイメージはああなんでしょうね。

 

f:id:asilla:20170422163436j:plain

某社にお伺いしたときにエントランスにあった国内最強のスパコン。

水冷のノズルが溶接してあるところとか、ワンオフの美しさといいますか、まるで芸術作品のようです。欲しい。

日本の未来は、日本のディープラーニング技術は、こういった企業のみなさんが支えているのです。「二位じゃダメ」とか、そういうこと抜きに、ディープラーニングの持つポテンシャルを、どう日本に、日本のビジネスに活かしていくかを前向きに考えたいですね。

 

f:id:asilla:20170422163425j:plain

最後に、渋谷紀伊国屋のゴジラ(非売品)です。欲しい。

我ら破壊と創造をもたらすゴジラたらんことを。