\(n\)個のデータの対 \((x_1,y_1),\ldots,(x_n,y_n)\) の相関を測る場合. n(n-1)/2 個の対 \((x_i,y_i)\) と \((x_j,y_j)\) について, 同順序の対の数を P,逆順序の対の数を Q とする. 例えば,\(x_i\gt y_i\) かつ \(x_j\gt y_j\) なら同順序.
同順序がない場合, \[\tau=\frac{P-Q}{n(n-1)/2}\] がKendall順位相関係数.Kendall τともいう.
同順位がある場合, \(x_i\) の中で同順位がある各ブロックの大きさを \(t_{xi}\) とする.例えば,2と3位,4,5,6位が同順位なら,\(t_{x1}=2\) と \(t_{x2}=3\) となる.このとき,\(T_x=\sum t_x(t_x-1)/2\) を計算. \(T_y\) も同様に計算. このとき,順位相関係数は \[\tau=\frac{P-Q}{\sqrt{n(n-1)/2-T_x}\sqrt{n(n-1)/2-T_y}}\]
二つのランダムな順序の間のSpearman順位相関係数 τの分布は, n>35 程度ならば,ρは分散が \(n(n-1)(2n+5)/18\) の正規分布で近似できる.これを用いてノンパラメトリックな相関の検定が可能.
-- しましま