\(n\)個のデータの対 \((x_1,y_1),\ldots,(x_n,y_n)\) の相関を測る場合. \(x_1,\ldots,x_n\) をその値の大きさで整列した順序で \(x_i\) が位置する順位を \(r_{xi}\) で表す.\(y_i\) についても同様に \(r_{yi}\) を計算する.このとき,\((r_{x1},r_{y1}),\ldots,(r_{xn},r_{yn})\) の間のPearson相関係数がSpearman順位相関係数となる. これはSpearman ρとも呼ばれる.
同順位がない場合は \[\rho=1-\frac{6\sum_{i=1}^n (r_{xi}-r_{yi})^2}{n(n^2-1)}\] で計算できる.
同順位が生じる場合は midrank を用いる. 2と3位の対象が同じ値ならば,これらの対象に平均順位 (2+3)/2=2.5位を与える. この midrank を用いて,Pearson相関係数を求めると,同順位がある場合のSpearman順位相関係数となる.
二つのランダムな順序の間のSpearman順位相関係数 ρの分布は, n>35 程度ならば,ρは分散が 1/(n-1) の正規分布で近似できる. n>10 程度ならば, \[t_{n-2}=\frac{\rho\sqrt{n-2}}{\sqrt{1-\rho^2}}\] は,自由度 df=n-2 のt分布に従う.これを用いてノンパラメトリックな相関の検定が可能.
-- しましま