機械学習

機械学習とは、「経験からの学習により自動で改善するコンピューターアルゴリズムや、その研究領域で、人工知能に一種であるとみなされているもの」である。

機械学習の手法として、以下の代表的な3種類のカテゴリーに分けられる。

教師あり学習

与えられたデータ(入力)を元に、そのデータがどんなパターン(出力)になるのか、その間にどのような関係があるのかを識別・予測する手法。

ここでいう「教師」とは、出力データのことを指し、多くの場合、人間がこの役割を担っている。

また、予測したいものによって2種類の予想問題に分けられる。

回帰問題

数字(連続する値)を予測する問題

ex.)過去の売上から、将来の売上を予測する

分類問題

離散値(連続しない値)を予測する問題

ex.)与えられた動物の画像が、なんの動物なのかを識別する

教師なし学習

学習で用いるデータに教師ラベルがなく、入力データそのものが持つ構造・特徴が対象となる手法。

データそのものが持つ構造・特徴を見つけることを目的に学習を行う。

ex.)1⃣ECサイトの売上データから、どういった顧客層があるのかを認識する。
ex.)2⃣入力データの各項目間にある関係性を把握する。

教師あり学習との違い

教師あり学習は入力と出力がセットとなったデータを扱うのに対し、教師なし学習では学習に用いるデータに出力が存在しない。(「正解ラベル」の有無)

強化学習

概要

正解を与える代わりに、将来の報酬や利益を最大化することで、特定の状況下のおける行動を学習する枠組み。

強化学習では、エージェントといわれる何らかの環境に置かれた行動する主体(ロボットのような)が、環境の「状態」を観測し、それに基づいた「行動」を行う。

その結果として環境の状態が変化し、エージェントは環境から「報酬」を受け取ると同時に「新しい状態」を観測する。

この繰り返しによって、エージェントが得る報酬の総和を最大にする行動パターンを身につけることが目標である。

まとめ

教師あり学習:入力と出力(正解ラベル)のペアデータを使って入力から出力への変換方法を学習
教師なし学習:正解ラベルのないデータを使ってデータに潜む構造を学習
強化学習:エージェントが環境と相互作用しながら集めたデータを使って高い報酬を得る方法を学習

上記の通り、それぞれが対象とする課題の種類が異なっているので、どれかが特別優れている、といったことはありません。扱う問題や目的に応じて使い分けることになります。