スポンサーリンク
最近統計の勉強をしているのですが、基礎を学びなおそうと思って読んでみました。
すごいわかりやすく書かれているので、初学者にもオススメです。
統計学の役割
統計学の役割を大きく分けると4つに分類できます。
- 概念の計量化
- 予測
- 仮説の検証
- 分類
データについて
大きく分けると、
- 横断面データ
- 時系列データ
に分けられる。
データの整理
データを整理して見やすくする方法は、主にこの4つである。
- 度数分布表:
- ヒストグラム:度数分布を棒状グラフで表したもの。
- 箱ひげ図:5数要約値を図で表したもの。
- 散布図
5数要約値とは、最小値・最大値・メディアン・第1四分位数・第3四分位数である。
データの指標
- 平均
- 中央値(メディアン)
- 最頻値(モード)
- 分散:偏差(散らばりの程度)の二乗
- 標準偏差:分散の平方根
- 共分散:偏差積の平均
- 相関係数:-1~1で、1に近ければ正の相関ありで、−1に近ければ負の相関。
確率
まず確率を考える前に、データには標本と母集団がある。
データを発生させる構造を母集団、母集団の一部を切り取ったものを標本という。
- 条件付き確率:事象bが与えられるときにAの条件付き確率。
- ベイズの定理:式で表すとこんな感じ。
$$ P(A |B) = \frac {P(B |A) P(A)} { P(B)}$$
- 期待値:なにかが生じる確率
ベイズ知りたい方はこちらへ
分布
主な分布はこんな感じ。
- 正規分布★★★:一番有名。山。身長体重とか。基本これ
- 一様分布★★:ルーレットの出目の分布(乱数の生成)
- 二項分布★:n回コインを投げたときの表が出る確率の分布
- ポアソン分布★:1年に何人の兵士が馬に蹴られて死ぬ確率の分布
- 幾何分布:災害が起こる確率
- 対数正規分布:富の分布(裾野が広い)
正規分布は、中心極限定理(量が大きいと正規分布に近似できる)を使って近似している。
推定
主な推定はこんな感じ。
- 点推定:1つの点を推測する
- 区間推定:区間を推測する。信頼区間を表記する。
- 最尤推定:事前確率を使用せずに尤度のみでパラメータを推定する。一番それっぽいところを予想すること。
- MAP推定: 事前確率と尤度の両方を使用し、点として推定する
- ベイズ推定: 事前確率と尤度の両方を使用してパラメータを推定する
仮説検定
- 帰無仮説:仮説の基準。
- 対立仮説:帰無仮説の逆。
- 有意水準:帰無仮説が正しいときに、帰無仮説を否定する確率
検定方法はこんなのがある。
引用 https://www.statweb.jp/method/sentaku-houhou
回帰分析
回帰分析は以下の式で表せる。
$$ y_i =\alpha + \beta x_i + \epsilon_i \ (i=1,2,\cdots,n) $$
(説明変数\(x_i\)、被説明変数\(y_i\)、誤差項\(\epsilon_i\)、回帰係数\(\alpha ,\beta\))
スポンサーリンク
スポンサーリンク