判別分析(はんべつぶんせき)は、事前に与えられているデータが異なるグループに分かれることが明らかな場合、新しいデータが得られた際に、どちらのグループに入るのかを判別するための基準(判別関数)を得るための手法。
判別関数には超平面・直線による線形判別関数(linear discriminant function)と、非線形の場合には超曲面・曲線によるマハラノビス汎距離(Mahalanobis' generalized distance)による非線形判別関数とがある。
3つ以上のグループの判別も可能である。これは重判別分析(multiple discriminant analysis)や正準判別分析と呼ばれる。
判別式の妥当性は、誤判別率などで評価できる。適した変数選択と判別方法にもとづいて分析することが必要であり、判別式(のみならず変数選択)の妥当性を検証する手法として、元のデータから1つだけ外して判別(モデル)式を得、外したデータを新たなデータとして適用した際に妥当な結果が得られるかを検証する、1つとって置き法(leave-1-out)などが一般に用いられる。
入試を具体例に取ると、個々の受験生は、各群に属する個々の入試得点により、合格・不合格という2群に分けられる。学校側で明確な基準を設ける場合、たとえば英語で100点満点中70点を合否ラインにした場合、生徒の合否は得点が70点を境に分かれることとなるが、合否基準が非公開な場合や、その年度によって、合格者の平均点も変動することは周知である。
このような教師データが存在する場合(予備校などでは自己採点結果などから、相当に精度の高い標本を有しており、これを教師データとして扱うことは相応に妥当と考えられる)、判別分析により、過去の受験生の点数実績と合格実績から、合否の基準を計算によって求めることができる。
線形判別関数 (y=a1x1+a2x2+…+anxn+a0) の求め方を以下に示す。
いま話題のニュース
モバNEWSにはいま話題のニュースがいっぱい
このページを友達に送る
URLをコピー
本日のガリガリ君 【品質管理】主成分分析、因子分析、判別分析、クラスター分析
判別分析。 http://t.co/hP5FBZte
画像の局所ブロックにおける再帰的多階調閾値処理のなかで、再帰的判別分析法によって得られた各しきい値がそれらしい値にならない。再帰関数はソースコードに起こす上で楽だけど、流れが見えづらくて辛い。