相関係数の求め方について質問です。
初めに、自分数学はかなり苦手なので噛み砕いて教えていただけると有り難いです…
相関係数は xとyの共分散÷xの標準偏差× yの標準偏差 で求めています。
共分散は xの偏差× yの偏差 の総和÷データ数 で求めています。
データが10程度の場合は数分で求められますがデータが30以上ある場合、xとyの偏差を求める時間がかなり掛かってしまいます。
データが多い場合に短い時間で相関係数を求められる公式などはあるのでしょうか?
あと、相関関係の強弱に関して。
データの相関について復習していたところ、
相関係数rの範囲が-1≦r≦1であることに疑問を持ったので、調べると証明方法が出てきたので理解できましたが、
rが-1または1に近いことがそれぞれ正負の相関関係が強いことを示す理由が分からないです。
r(相関係数)=Sxy(x,yの共分散)/SxSy(x,yの標準偏差の積)
と表されるため、分母の各標準偏差の値が大きくなる(≒データの散らばりが大きい)と相関係数の値が小さくなるのは分かるのですが、
だからといってXnとYn(n=1〜データの大きさ)の各ペアが直線状に並ぶとは言えないのではないのでしょうか。
n次元ベクトルを用いた相関係数の値の範囲の証明は調べてなんとなく分かったのですが、大学の数学は全く知らないレベルです。
ご教授よろしくお願いしますm(._.)m
相関係数について質問があります。
フォーラムルール
新規投稿は質問のみとさせていただきます。
新規投稿は質問のみとさせていただきます。
Re: 相関係数について質問があります。
最初の質問ですが
共分散、分散の計算をちょっと楽にする方法ならあります。
Xの平均値をE[X]=μのように表します。
Xの分散は、
E[(X-μ)²]=E[X²]-2μE[X]+μ²=E[X²]-μ²
データから平均値をいちいち引いてから2乗和をとり平均を求めるより、データの二乗和の平均を取ってから平均値の2乗を引けばよいので計算が楽になります。
同様に、Xの平均値をμx, Yの平均値をμyとして、共分散はE[(X-μx)(Y-μy)]=E[XY]-μxμyのように表せます。
これらを使うとちょっとは楽になると思います。
例えば、(x,y)の組が(1,2) (3,4) (5,6)なら、
Xの平均は3
Xの分散は(1²+3²+5²)/3 - 3² = 2.67
Yの平均は4
Yの分散は(2²+4²+6²)/3 - 4² = 2.67
X, Yの共分散は(1×2 + 3×4 + 5×6)/3 - 3×4 = 2.67とかですかね
2つ目の質問ですが
ベクトルを使った考え方だと簡単に言えるので
それで話をすればいいと思います。
まず高校範囲のベクトルについて復習
2つのベクトルa,bについて
aとbとのなす角が0°とは
この2ベクトルの向きが等しい事
aとbとのなす角が180°とは
この2ベクトルが逆向きである事
いずれの場合もb=kaとなる実数t(≠0)が存在する
a=(a1,a2),b=(b1,b2)とすると
b1=ka1かつb2=ka2
高校では3次元の話まで学習するが
4次元以上でもこれは同じ事です。
※「x[i]の平均」をx*と表記します
x,yの偏差ベクトルをX,Yとすると
この2ベクトルのなす角のcosが相関係数
相関係数が1とはなす角が0°
相関係数が-1とはなす角が180°
いずれの場合もY=kXとなる実数kが存在する
よって任意のiについて
(y[i]-y*)=k(x[i]-x*)
y[i]=k(x[i]-x*)+y*
すなわち任意のiについて(x[i],y[i])は
直線y=k(x-x*)+y*上です
長くなりましたが、ご確認お願い致します。
共分散、分散の計算をちょっと楽にする方法ならあります。
Xの平均値をE[X]=μのように表します。
Xの分散は、
E[(X-μ)²]=E[X²]-2μE[X]+μ²=E[X²]-μ²
データから平均値をいちいち引いてから2乗和をとり平均を求めるより、データの二乗和の平均を取ってから平均値の2乗を引けばよいので計算が楽になります。
同様に、Xの平均値をμx, Yの平均値をμyとして、共分散はE[(X-μx)(Y-μy)]=E[XY]-μxμyのように表せます。
これらを使うとちょっとは楽になると思います。
例えば、(x,y)の組が(1,2) (3,4) (5,6)なら、
Xの平均は3
Xの分散は(1²+3²+5²)/3 - 3² = 2.67
Yの平均は4
Yの分散は(2²+4²+6²)/3 - 4² = 2.67
X, Yの共分散は(1×2 + 3×4 + 5×6)/3 - 3×4 = 2.67とかですかね
2つ目の質問ですが
ベクトルを使った考え方だと簡単に言えるので
それで話をすればいいと思います。
まず高校範囲のベクトルについて復習
2つのベクトルa,bについて
aとbとのなす角が0°とは
この2ベクトルの向きが等しい事
aとbとのなす角が180°とは
この2ベクトルが逆向きである事
いずれの場合もb=kaとなる実数t(≠0)が存在する
a=(a1,a2),b=(b1,b2)とすると
b1=ka1かつb2=ka2
高校では3次元の話まで学習するが
4次元以上でもこれは同じ事です。
※「x[i]の平均」をx*と表記します
x,yの偏差ベクトルをX,Yとすると
この2ベクトルのなす角のcosが相関係数
相関係数が1とはなす角が0°
相関係数が-1とはなす角が180°
いずれの場合もY=kXとなる実数kが存在する
よって任意のiについて
(y[i]-y*)=k(x[i]-x*)
y[i]=k(x[i]-x*)+y*
すなわち任意のiについて(x[i],y[i])は
直線y=k(x-x*)+y*上です
長くなりましたが、ご確認お願い致します。