統計における交絡関係。…

0
121

 
NASAスペースアップスチャレンジの解説で、統計における交絡関係という言葉が登場した。ちょっと気になったので、考えてみた。 
 
例えば、「人口密度が高いほと、コロナウイルスの感染者数が多い」・・そのようなグラフがあったとしても、これらが本当は、無関係という場合があるらしい。このような場合を、交絡関係(疑似相関)というらしい。
 
分かりやすい例だと、「身長が高い子供ほど、成績が良い」というグラフがあったとしても、ウソなのだろうだ。なぜなら、実際には、「年齢が高いほど、身長が高くなり、成績もよくなる」というのが統計上の事実だからだそうだ。
 
そういえば、よく知られていうように、プロ野球選手は、4月生まれが、圧倒的に多い。選手の体格の他に、選手選抜による環境要因が、この差を作り出していると、考えられている。もっとも、1月生まれだけは、少しだけ、統計から外れているのだか、なぜだろうか? 「1」という数字のレッテル効果かもしれないし、単なる誤差かもしれない。
  
イチローは10月生まれだから、スーパー選手は、統計データとは、無関係なのかもしれないし、ビルゲイツは10月、ベゾスは1月、スティーブジョブズは2月生まれ。彼らの見た目に共通のキーワードは、たぶん、「自信」ではないだろうか。
  
そういえば、高校野球の場合、監督の影響が大きい。だから、体格差というよりも、「自己肯定ができるココロの環境」が、データに差ができる本当の要因なのかもしれないと、思ったりもする。
 

出典:生まれ月の順風効果と逆風効果 
https://www.jstage.jst.go.jp/article/jpmyu/13/1_2/13_71/_pdf




Source

LEAVE A REPLY

Please enter your comment!
Please enter your name here