統計的なものの見方 経済学部 西尾教授
・統計学は何かというと、統計的なものの見方の緩やかな体系である。統計では、集団のバラツキをどう捉えて
処理するかということである。統計的に処理した結果の多くは常識的なものであるが、数値化できるのが特徴
である。西内さんの“統計学は最強の学問である”という本は30万部も売れたと言われている。統計の本は最も
売れても1万部と言われているので、驚きの売れ行きである。ダニエル氏の“統計でうそをつく方法”という本は
世界的に売れている。私も授業をまとめた“グラフィック統計学”が売れると言われて出したが、売れていない。
・統計では、集団から目的に沿ってデータを取り出し、情報にする。その情報に基づき、戦略を決定するのであり、
集団からどうやってデータを取り出すことと、データから情報を整理することが行われる。統計学の多くの場合、
データから情報を解析する部分を扱っているものが多い。
・例えば、天秤を2回使って、2つのものの重さを測る場合であるが、天秤には、必ず、誤差がある。誤差はあるが
分からないが、どうすれば、誤差が減らせるかというテーマである。物体Aと物体Bを各々測る場合よりも、AとB
を一緒に図り、AからBを引いたものを測る場合の方が誤差が半分になるということが分かる。どうやってデータ
を取ると質の良いデータが取れるかが重要になる。ある年の統計学の試験の成績について、度数分布を作るが、
もっと分かり易くするため、ヒストグラムを作って、下駄を履かすか考える時に利用する。
・データを要約して、見やすくして活用する。もう一方は代表値を使う場合がある。その一つが平均値であり、もう
一つが中央値である。平均値と中央値はだいたい同じか、近くなる。例えば、身長は正規分布になるので、同じ
になる。しかし、体重は右にゆがんだ分布になる。この場合は平均値が中央値より大きくなる。2人以上の世帯の
年収をまとめると右にゆがんだ分布になっている。世の中で発表されるのは平均値が多い、中央値は平均値より
低くなっているが、自分が世の中のどの位置にいるのかを考える場合は中央値が良いと思う。平均値が普通を
捉えられることが多いが、平均値は外れ値の影響を受けるので、中央値を使うことが良い場合もある。すい星が
来る周期を予言したハレーが寿命の統計を出したことがある。寿命をあと何年生きられるかを考えるのならば、
人数的に最も多くなる中央値が適当である。平均値が意味があるのは保険会社である。金額を出す時に平均値
が必要になる。世の中は何でも平均値で見る傾向があるが、内容的には中央値で見ることも大事である。
・ペルシャ絨毯の値段交渉で、売る方は10万円と言い、買う方は1万円と言って交渉を始めたが、売主が平均を
取って5万円にしたらどうかと言い出した。その時、買う方はかけ算の中を取ると、3万円になると言ったという
話である。相加平均は必ず相乗平均より高くなるので、このような場合は相乗平均を使うことも大事である。
・データを情報にするには確率を使って分析する古典的な統計学がある。確率を授業で使うと学生がこなくなった。
経済学部では統計は必須にしていたので、最初は300人以上来ていた学生が2人まで減ったことがある。統計
では確率を判断材料として使うが、判断する時には解釈が必要となる。サイコロで偶数が出る確率は2、4、6の
3通りなので50%だというのは組み合せ論である。これはすべての目が公平に出るということが前提であるが、
実際には偏りがある。大数の法則があり、サイコロを転がしてみて、回数を増やしていくと一定の割合に近づくと
いう経験則がある。サイコロの偏りを、その数値を前提にする方法であり、これを頻度主義という。それに対して
主観主義がある。頻度主義とは結びつかない。客観性が求められる場合は、主観確率は使えないが、人により
見方が変わるような不確実な状況の中で決定する場合は主観確率が使えることもある。会社で社長の判断で
ものを決める場合は主観確率を使う場合がある。確率は良く分からない場合がある。
「感想」経済学部で説明する統計学について、お話を聞くことが出来た。前半は何となく理解できたが、
主観確率の例題は良く理解できなかったので、まとめるのは止めにした。先生が言われるように
統計は分からないところがあると思いました。