楽屋

Pythonで画像を分類③

こんにちは、データ事業部2部アナリストのヤマモトです。

DATUM STUDIOは、先日5月9日(水)〜11日(金)に東京ビッグサイトで開催された「第27回Japan IT Week 春/ビッグデータ活用展」に出展しておりました。

私も弊社ブースに来てくださったお客様にご説明をしたり、他のブースや展示会場を覗いてどのような分野・働きかけ方が人気があるのかをリサーチしたり、とても実りのある時間を過ごしました。

弊社のイベントやセミナー、講演会についての情報はぜひこちらをご覧ください。

 

さて、本記事は「何となくでいいから機械学習、ディープラーニングを理解してみたい」、「AIに興味がある」、そんな方々に向けた連載の続きです。

前回の記事では機械学習を用いてPythonという言語で実際に画像を分類しました。

上の図のようなステップを踏んだわけですが、お客様にご説明をする際に「”モデルを使って学習及びテストデータの分類をさせる”とありますが、”モデル”って何ですか。」と聞かれることが時々あります。

ということで今回は、モデルとは何か、について書きたいと思います。

(前回の記事で使用したロジスティック回帰というモデルについての説明の記事や、モデルの選択方法についての記事は同じ楽屋ブログにございますので、ご興味がありましたらそれぞれご覧ください。)

 

●モデルとは何か?

モデルという言葉は機械学習の領域において、二通りの意味で使われているように見受けられます。

一つは、コンピュータに学習をさせるための手法、という意味です。

もう一つは、実際の事象において「学習をさせるための手法」に具体的な数値を入れて性能評価をできるようにしたもの、をモデルと呼ぶ場合です。

一つずつ見ていきましょう。

 

●コンピュータに学習をさせるための手法

“機械学習”、”モデル”、”種類”、で検索をすると、ロジスティック回帰やランダムフォレストなどを”モデル”として紹介したサイトが表示されます。

このときの”モデル”は、「学習を実現するための手法」を示しています。

コンピュータで学習を実現しようとしたとき、その目的によってそのアルゴリズム(計算方法)は幾通りもあるのですね。

●実際に性能評価をできるようにしたもの

他方で、前述の手法はあくまでもアルゴリズム(計算方法)であり、実際にトレーニングデータを学習させて数式の値を調整し性能評価をできるようにしたものがモデルである、という立場もあります。

弊社がパートナーシップを結んでいますMicrosoft Azureも、手法に関しては「機械学習”モデル”」ではなく、「機械学習”アルゴリズム”」チートシート、という名称でガイドを作っています。

(Microsoftが提供しているAzure Machine Learning(Azure ML)のサービスはプログラムを書く必要なく機械学習を使用することができる、というブログ記事はこちら)

 

●まとめ

「機械学習の導入を専門家に頼んだら”モデル”という言葉を連呼されたが、”モデル”って何だ?」

と思われたら、

・コンピュータに学習をさせるためのアルゴリズム(計算手法)のこと

・上記のアルゴリズム(計算方法)に、実際のデータを学習させて数式の値を調整し性能評価をできるようにしたもの

2つのうちのどちらかを示している可能性が高いです。

そうでないこともあるかもしれませんが、わからないことがあれば遠慮なく聞いてください。

それをお客様に安心感をもってわかりやすく説明できるのが、プロのデータサイエンティストでしょうから。

 

次回はいよいよ、ディープラーニングを用いて画像を分類します!

近日中に実際のコードについての記事と、それについての説明の記事をアップしますのでお付き合いくださると幸いです。

 

弊社DATUM STUDIOでは、私の他にも様々なバックグラウンドをもったデータサイエンティストがオーダーメイドで分析を行っております。

お問い合わせはこちらへお願い致します。