相関係数の話の続きです.
今回は,相関係数が正になったり,負になったりすることを直感的に理解することが目的です.
散布図の構造と相関係数
上の式で計算した相関係数が,に近かったり,に近かったり,に近かったりすることと,散布図の関係はどうなってるのでしょうか.
標本平均,を引くのは,値のばらつきを0まわりにするためなので,以下では簡単化のため,,の標本平均が0の場合を考えます.
です.この分子
の値を,散布図の象限毎に分けて考えると,相関係数の正になったり,負になったりすることの直感的な意味が見えてきます.
下の図で,第1象限と第3象限にある点は,符号が同じなので,
です.それに対し,第2象限と第4象限にある点は,符号が逆なので,
です.
下の図では,一番右の図が,象限毎のの和をで割った値を示しています.
散布図が,右上がりだと,の割合が多いので,相関係数は正になります.特に右上がり45°の直線に近いほど,の値が大きくなります.
逆に散布図が,右下がりだと,の割合が多いので,相関係数は負になります.
相関係数が0に近いときは,になる領域と,になる領域で,ほぼ対称に点が分布しているということです.
今日のまとめ
今日,Breaking Down 6を見ました.私は昔,番組を間違えてBreaking Down 3のペーパービューを買ってしまったことがあります.そのときは,せっかくなので何試合か見ましたが,試合の面白さがまったく分かりませんでした.その後,Breaking Downへの出場のためのオーディションをYoutubeで見るようになり,Breaking Downに出場して有名になりたいという人たちの振舞に,面白みを感じるようになりました.殴り合いの喧嘩って良いことではありませんが,外から見ているとドキドキする感じはします.
私は昔,歌舞伎町の飲み屋で見ず知らずの方々と喧嘩になり,顔を激しく殴られました.今でも顔の左に痺れが残っています.あのとき脳にダメージを受けていなければ,もっと科学者として活躍できたかもしれませんが,今では命があっただけ良かったと思います.若いときのことを思い出すと,なんであんなに愚かだったのかと,恥ずかしくなります.