距離を用いて、正常/異常の診断を行う判別分析の手法。
正負の符号は無く、距離が大きければ異常であり、小さければ正常となる。
マハラノビスの距離を用いた判別方法と目的は同じであるが、正常なものはパターンを持つが、そのパターンと異なるものは全て異常であり、特定のパターンを持たないと考え、正常なデータだけを研究することを推奨する点が独創的である。
正常なサンプルの複数項目のデータセットを単位空間と呼ぶ。
何を「正常」と考え、単位空間とするかは目的により自由だが、より均質なものを単位空間にした方が判別精度は向上する。
方法:
正常な複数(2個以上)のサンプル(複数項目のデータセットを持つ)を集める。
各項目の平均値を計算する。
全項目が各項目の平均値となったサンプルは最も正常と考える。
各項目の平均値を信号とし横軸にとり、評価したいサンプルの項目を縦軸にとった場合、原点を通る傾き1の直線に近いほど正常なデータといえる。
複数の項目から、傾き1の直線に対し、直線だが傾きが異なりズレた場合(傾きβ)と、傾きは1に近いが非線形のためにズレた場合(SN比)の2項目に集約して分析を行う。
傾きβとSN比の大きさにより異常への影響度が異なると考え、余因子行列を用いて2項目の相関を省いた重みづけを行い距離Dを計算する。
この重みによる式を用いて、正常データの距離のバラツキを計算し閾値を決定する。
問題点:RT法では傾き1の直線からのズレで評価するため、信号が大きいところでの1%のズレと小さいところでの1%のズレは対等ではなく、大きい方が高く評価される。
したがって、特定の項目の単位を変える、例えばメートルをミリメートルにするとその数字が大きくなるため、その項目の重みが高く評価されることになり、結果が変わることもある。
対策:項目の単位はできるだけ揃えるか、基準化などの無次元化を行う。
基準化を行った場合は望目特性として、平均と望目SN比での解析となる。