k近傍法(k-nearest neighbor algorithm, k-NN)#
k-NNとは?#
概要#
k-NNとは,教師あり学習の一種です.主にクラス分類に利用されます.
●k-NNの立ち位置
機械学習
教師あり学習
クラス分類
二クラス分類
他クラス分類
k-NN
回帰
k-NN
今回は説明しませんが,k-NNは回帰問題にも活用できます.
さて,教師あり機械学習では
fit
:パラメータの訓練ステップpredict
:訓練で得たパラメータを使って未知のデータのラベルを予測するステップ
の2ステップが主に存在しますが,k-NNではパラメータと呼べるものはありません.そのため,predictステップのみを実装すればOKです.k-NN(のpredictステップ)では以下の手順でクラスラベルを予測します.
Important
k-NNのpredictステップの手順:
訓練データと訓練ラベルを保持し,テストデータ(未知データ)が与えられた時に,テストデータのそれぞれから最も近い距離にあるデータk個をピックアップします.
ピックアップされたデータの持つラベルの中で,最も頻出する訓練ラベルをそれぞれのテストデータの予測ラベルとします.
アルゴリズムの説明は上の二行で終わりです.
より具体的に#
下に参考になりそうな動画を貼っておきます.