中級

ML (Machine Learning)

ML(機械学習)は、人工知能(AI)の一分野であり、コンピュータが大量のデータからパターンやルールを自動的に学習し、それに基づいて予測や判断を行うための技術や手法の総称です。

#機械学習#データサイエンス
公開: 2025年8月29日更新: 2025年9月6日

人間が一つ一つルールを教え込むのではなく、大量のデータを食わせて、コンピュータ自身に法則を見つけさせる。それがML、機械学習だ。AIという巨大な概念の中核を成す、データ駆動型のアプローチだ。

MLとは

  • Machine Learningの略。
  • 明示的にプログラムされなくても、コンピュータがデータから「学習」し、物事を識別したり、未来を予測したりする能力を獲得するための技術体系。
  • 統計学やアルゴリズムを駆使して、データに潜むパターンを抽出し、それをモデルとして構築する。

主要な学習方法

MLの学習アプローチは、主に3つに分類される。教師の有無で区別しろ。

  1. 教師あり学習 (Supervised Learning)
    • 最も一般的で強力な手法。
    • 「正解ラベル」が付いたデータ(例:「この画像は猫」「このメールはスパム」)を大量に与え、入力と正解の関係性を学習させる。
    • 学習後は、未知のデータに対しても、学習したパターンを元に、正解を予測・分類できるようになる。迷惑メールフィルタや画像認識で使われる。
  2. 教師なし学習 (Unsupervised Learning)
    • 正解ラベルのない、生のデータをそのまま与える。
    • コンピュータは、データの中に存在する構造や類似性を見つけ出し、自律的にデータをグループ分け(クラスタリング)する。
    • 顧客のセグメンテーションや、異常検知(普段と違うパターンの発見)などに使われる。
  3. 強化学習 (Reinforcement Learning)
    • 正解を与えるのではなく、「報酬」というヒントを与える。
    • システム(エージェント)は、試行錯誤を繰り返しながら、どうすれば最も多くの報酬を得られるかを学習していく。
    • ゲームのAIや、ロボットの自動制御などに使われる。

セキュリティ分野での応用

  • UEBAのように、平常時の通信パターンを学習し、逸脱する異常な振る舞いを検知する。
  • スパムメールやマルウェアの特徴を学習し、未知の亜種をブロックする。

MLは魔法ではない。学習に使ったデータの質と量が、そのまま性能に直結する。偏ったデータで学習させれば、偏った結果しか返ってこない。その限界と特性を理解した上で、使いこなす必要がある。