中級
ML (Machine Learning)
ML(機械学習)は、人工知能(AI)の一分野であり、コンピュータが大量のデータからパターンやルールを自動的に学習し、それに基づいて予測や判断を行うための技術や手法の総称です。
#機械学習#データサイエンス
公開: 2025年8月29日更新: 2025年9月6日
人間が一つ一つルールを教え込むのではなく、大量のデータを食わせて、コンピュータ自身に法則を見つけさせる。それがML、機械学習だ。AIという巨大な概念の中核を成す、データ駆動型のアプローチだ。
MLとは
- Machine Learningの略。
- 明示的にプログラムされなくても、コンピュータがデータから「学習」し、物事を識別したり、未来を予測したりする能力を獲得するための技術体系。
- 統計学やアルゴリズムを駆使して、データに潜むパターンを抽出し、それをモデルとして構築する。
主要な学習方法
MLの学習アプローチは、主に3つに分類される。教師の有無で区別しろ。
- 教師あり学習 (Supervised Learning)
- 最も一般的で強力な手法。
- 「正解ラベル」が付いたデータ(例:「この画像は猫」「このメールはスパム」)を大量に与え、入力と正解の関係性を学習させる。
- 学習後は、未知のデータに対しても、学習したパターンを元に、正解を予測・分類できるようになる。迷惑メールフィルタや画像認識で使われる。
- 教師なし学習 (Unsupervised Learning)
- 正解ラベルのない、生のデータをそのまま与える。
- コンピュータは、データの中に存在する構造や類似性を見つけ出し、自律的にデータをグループ分け(クラスタリング)する。
- 顧客のセグメンテーションや、異常検知(普段と違うパターンの発見)などに使われる。
- 強化学習 (Reinforcement Learning)
- 正解を与えるのではなく、「報酬」というヒントを与える。
- システム(エージェント)は、試行錯誤を繰り返しながら、どうすれば最も多くの報酬を得られるかを学習していく。
- ゲームのAIや、ロボットの自動制御などに使われる。
セキュリティ分野での応用
- UEBAのように、平常時の通信パターンを学習し、逸脱する異常な振る舞いを検知する。
- スパムメールやマルウェアの特徴を学習し、未知の亜種をブロックする。
MLは魔法ではない。学習に使ったデータの質と量が、そのまま性能に直結する。偏ったデータで学習させれば、偏った結果しか返ってこない。その限界と特性を理解した上で、使いこなす必要がある。