P30 本来は分けて考えなければならないデータが、一緒くたに論じられていることは珍しくありません。私達にできる対処法は、何らかの調査結果を見るとき、「何と何を比較しているか」を確認することでしょう。データは、大雑把に、あるいは部分的に提示されることが多いのです。そこに抜けている情報や、やけに小さな字で書いてある注意書きなどは無いでしょうか。わざと疑い深くなってみたり、目を皿のようにしてデータを見ることで、実態が見えてくることもあります。

P39 標準偏差は、「平均との差を2乗した値の平均を計算し、さらにそのルート(平方根)を取ったもの」です。つまり、平均値との差を2乗したものをすべて足しあわせ、データの個数で割ってから、そのルートを求めます。

P42 データのバラツキ具合は、多くの場合、標準偏差で測ります。

P74 正規分布は、独立な確率変数(ランダムに変わる量)の足し算によって現れる。
正規分布の確率密度は、平均と分散(標準偏差)だけで決まるハンドベル型の曲線。
確率密度のグラフの下の部分の面積が対応する確率を表す。
正規分布では、平均プラスマイナス(1.96x標準偏差)の範囲に95%のデータが収まる(区間推定)。これを用いて当選確実などの判定ができる。

P108 ある仮説(帰無仮説)が正しいといってよいかどうかを統計学的に判断する方法を検定という。
仮設が正しいとき、サンプルが観察される確率をP値という。
P値が定めておいた値(有意水準)よりも小さいとき、帰無仮説を棄却し、対立仮説を指示する。
仮設を検定する方法のひとつにカイ2乗検定があり、クロス表の検定に適している。
カイ2乗検定を行なうには、カイ2乗値と自由度が必要。
カイ2乗検定で使われるカイ2乗分布は自由度によって形が変わる。
帰無仮説をもとに計算される期待度数とサンプルの観測度数が同じなら、カイ2乗値はゼロ。期待度と観測度数のズレが大きくなると、カイ2乗値も大きくなる。

P132 回帰分析とは説明したい変数(被説明変数)と何らかの変数(説明変数)の間に指揮を当てはめる手法。
回帰直線とは、直線の式と値のズレの2乗を最小にするように決める。
式の当てはまり具合は、R^2値(アールスクエア)で表現する。
複数の説明変数を使った回帰分析を重回帰分析という。

P175 お互いに無関係な(独立な)事件、事故などが一定期間に何回起きたかを記録するとポアソン分布が現れる。


トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2013-02-11 (月) 14:38:32