Pythonで画像を分類①

弊社、DATUM STUDIOではAI構築サービスを提供しており、車の販売価格、不動産の空室率、映画の動員数などの予測の事例があります。

今まで積み重ねてきたディープラーニング技術をもって独自開発しました、Microsoft Azureを活用したAI文章校正ツールも提供しております。

 

先日4月13日に開催しましたReal.AIセミナーも募集200名のところ申込者数は約300名となりました、皆様のAIへの関心の高さが伺えます。

本記事では、”AI活用”の易しい例としてPythonで画像を分類する方法を連載していきます。

 

ご案内しますのは、このブログでTableauの記事を書いておりますデータ事業部2部のアナリスト、ヤマモトです。

何となく興味はあるんだけどプログラミングや数学は分からない。。。という方でも雰囲気を感じられるような記事にしたいと思いますのでよろしくお願いします。

 

Pythonで画像を分類する上での環境構築(システムなどが動作するようにコンピュータの状態を整えること)の方法は、ハリネズミ担当のS氏による過去のブログを参照くださいませ。

連載1回目は、AIや機械学習、ディープラーニングについての大雑把な理解を提供します。

 

●AI

AIは、「Artificial Intelligence」の頭文字を取った言葉で人工知能と訳されますが、解釈は様々で厳密な定義は無いようです。

「人工知能は人間を超えるか」(KADOKAWA中経出版、2015)の中で著者である松原豊氏は、「人工的に作られた人間のような知能」だとしています。

さて、これから取り組む画像の分類には機械学習を用いますが、AI・機械学習・ディープラーニングってどういう関係にあるのでしょうか。

それは下の画のようになります。

AIにおける研究分野の一つが機械学習であり、機械学習の手法の一つがディープラーニングです。

 

●機械学習

機械学習は、ざっくり言うと、コンピュータに学習をさせる技術です。

例としてよく出されるりんごの画像分類で説明しますと、

ある程度のりんごの画像に一つ一つに「赤い」か「青い」かのラベルを付けて、コンピュータにどのようなりんごの画像が「赤い」のか「青い」のかを学習させます。

その上で、新しいりんごの画像を分類するように指示をすると、赤いりんごか青いりんごかを判断してくれます。

(機械学習の中でも”教師あり学習”の”分類”と呼ばれるもの。)

 

●ディープラーニング

先の例では、「色」という特徴量を人間が定義する必要がありました。

ディープラーニングは、どんな特徴量を利用すれば識別できるのかをコンピュータが自ら学ぶようにする手法です。

りんごの例ですと、多くのりんごの画像から「丸に近い形」、「上下にへこみがある」、「赤や黄緑に近い色のものがある」などの特徴量をコンピュータ自身が見つけ出し、そもそもその画像がりんごであるかも判断できるようになっていくというものになります。

特徴量の抽出という人間が行っていたことを、コンピュータが自動的に入力から出力まで一括して実行できるようになったのです。

●まとめ

何となくの理解を提供できましたでしょうか。

次回からはPythonを用いて実際に画像を分類していきます。

 

弊社のAI構築サービス、セミナー等にご興味を持ってくださった方はお気軽にお問い合わせくださいませ。

このページをシェアする: