Spearman順位相関係数 (Spearman's rank correlation)

\(n\)個のデータの対 \((x_1,y_1),\ldots,(x_n,y_n)\) の相関を測る場合. \(x_1,\ldots,x_n\) をその値の大きさで整列した順序で \(x_i\) が位置する順位を \(r_{xi}\) で表す.\(y_i\) についても同様に \(r_{yi}\) を計算する.このとき,\((r_{x1},r_{y1}),\ldots,(r_{xn},r_{yn})\) の間のPearson相関係数Spearman順位相関係数となる. これはSpearman ρとも呼ばれる.

同順位がない場合は \[\rho=1-\frac{6\sum_{i=1}^n (r_{xi}-r_{yi})^2}{n(n^2-1)}\] で計算できる.

同順位が生じる場合は midrank を用いる. 2と3位の対象が同じ値ならば,これらの対象に平均順位 (2+3)/2=2.5位を与える. この midrank を用いて,Pearson相関係数を求めると,同順位がある場合のSpearman順位相関係数となる.

二つのランダムな順序の間のSpearman順位相関係数 ρの分布は, n>35 程度ならば,ρは分散が 1/(n-1) の正規分布で近似できる. n>10 程度ならば, \[t_{n-2}=\frac{\rho\sqrt{n-2}}{\sqrt{1-\rho^2}}\] は,自由度 df=n-2 のt分布に従う.これを用いてノンパラメトリックな相関の検定が可能.

-- しましま

関連項目

リンク集

関連文献


トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2010-02-11 (木) 16:11:25 (2491d)