ML (Machine Learning)

人間が一つ一つルールを教え込むのではなく、大量のデータを食わせて、コンピュータ自身に法則を見つけさせる。それがML、機械学習だ。AIという巨大な概念の中核を成す、データ駆動型のアプローチだ。

MLの学習アプローチは、主に3つに分類される。教師の有無で区別しろ。

教師あり学習 (Supervised Learning)
- 最も一般的で強力な手法。
- 「正解ラベル」が付いたデータ（例：「この画像は猫」「このメールはスパム」）を大量に与え、入力と正解の関係性を学習させる。
- 学習後は、未知のデータに対しても、学習したパターンを元に、正解を予測・分類できるようになる。迷惑メールフィルタや画像認識で使われる。
教師なし学習 (Unsupervised Learning)
- 正解ラベルのない、生のデータをそのまま与える。
- コンピュータは、データの中に存在する構造や類似性を見つけ出し、自律的にデータをグループ分け（クラスタリング）する。
- 顧客のセグメンテーションや、異常検知（普段と違うパターンの発見）などに使われる。
強化学習 (Reinforcement Learning)
- 正解を与えるのではなく、「報酬」というヒントを与える。
- システム（エージェント）は、試行錯誤を繰り返しながら、どうすれば最も多くの報酬を得られるかを学習していく。
- ゲームのAIや、ロボットの自動制御などに使われる。

MLは魔法ではない。学習に使ったデータの質と量が、そのまま性能に直結する。偏ったデータで学習させれば、偏った結果しか返ってこない。その限界と特性を理解した上で、使いこなす必要がある。

IT言葉辞典