書評

書評 倉田博史『大学4年間の経済学が10時間でざっと学べる』

最近統計の勉強をしているのですが、基礎を学びなおそうと思って読んでみました。

すごいわかりやすく書かれているので、初学者にもオススメです。

統計学の役割

統計学の役割を大きく分けると4つに分類できます。

  1. 概念の計量化
  2. 予測
  3. 仮説の検証
  4. 分類

データについて

大きく分けると、

  • 横断面データ
  • 時系列データ

に分けられる。

データの整理

データを整理して見やすくする方法は、主にこの4つである。

  1. 度数分布表:
  2. ヒストグラム:度数分布を棒状グラフで表したもの。
  3. 箱ひげ図:5数要約値を図で表したもの。
  4. 散布図

5数要約値とは、最小値・最大値・メディアン・第1四分位数・第3四分位数である。

データの指標

  • 平均
  • 中央値(メディアン)
  • 最頻値(モード)
  • 分散:偏差(散らばりの程度)の二乗
  • 標準偏差:分散の平方根
  • 共分散:偏差積の平均
  • 相関係数:-1~1で、1に近ければ正の相関ありで、−1に近ければ負の相関。

確率

まず確率を考える前に、データには標本母集団がある。

データを発生させる構造を母集団、母集団の一部を切り取ったものを標本という。

  • 条件付き確率:事象bが与えられるときにAの条件付き確率。
  • ベイズの定理:式で表すとこんな感じ。

$$ P(A |B) = \frac {P(B |A) P(A)} { P(B)}$$

  • 期待値:なにかが生じる確率

ベイズ知りたい方はこちらへ

分布

主な分布はこんな感じ。

  • 正規分布★★★:一番有名。山。身長体重とか。基本これ
  • 一様分布★★:ルーレットの出目の分布(乱数の生成)
  • 二項分布★:n回コインを投げたときの表が出る確率の分布
  • ポアソン分布★:1年に何人の兵士が馬に蹴られて死ぬ確率の分布
  • 幾何分布:災害が起こる確率
  • 対数正規分布:富の分布(裾野が広い)

正規分布は、中心極限定理(量が大きいと正規分布に近似できる)を使って近似している。

推定

主な推定はこんな感じ。

  • 点推定:1つの点を推測する
  • 区間推定区間を推測する。信頼区間を表記する。
  • 最尤推定:事前確率を使用せずに尤度のみでパラメータを推定する。一番それっぽいところを予想すること。
  • MAP推定: 事前確率と尤度の両方を使用し、点として推定する
  • ベイズ推定: 事前確率と尤度の両方を使用してパラメータを推定する

仮説検定

  • 帰無仮説:仮説の基準。
  • 対立仮説:帰無仮説の逆。
  • 有意水準:帰無仮説が正しいときに、帰無仮説を否定する確率

検定方法はこんなのがある。

  引用 https://www.statweb.jp/method/sentaku-houhou

回帰分析

回帰分析は以下の式で表せる。

$$ y_i =\alpha + \beta x_i + \epsilon_i \  (i=1,2,\cdots,n) $$

(説明変数\(x_i\)、被説明変数\(y_i\)、誤差項\(\epsilon_i\)、回帰係数\(\alpha ,\beta\))