つねぴーblog@内科専門医

アウトプットが趣味です。医学以外の事も投稿するやもしれません。名前は紆余曲折を経てつねぴーblogに戻りました

移転しました。

共分散の定義

✅共分散とは

共分散とは例えば1つのクラスの中で「英語の点数」と「算数の点数」というような2つの変数の関係の強さを測る指標である。

共分散を計算することで、英語の点数が高い人ほど、算数の点数が高いのか、あるいは関係ないのかなどを解析することができる。もし、英語の点数と算数の関係の相関がわかれば、算数の点数を伸ばすには英語の勉強をすることが重要かもしれないという可能性が示唆される(あくまで”可能性”なのは、関連するが、因果関係があるかどうかは話が別だからである)

 

✅共分散の定義

式を見れば分かる通り、共分散は2変数それぞれの偏差(xのデータの値-xの平均値)(yのデータの値-yの平均値)を掛けたものを足し合わせて最後にサンプル数で割っている。

 

この部分に注目すると、がともに連動してxの平均やyの平均よりも大きな値または小さな値を取ると、はプラスの値になる。一方で、片側が平均よりも大きな値で、もう片方が平均よりも小さな値を取ると、はマイナスになる。

 

これらを で総和を求めているので、xとyがどのように連動しているのかを求めることができる。

 

また追記します。