毎日1冊、こちょ!の書評ブログ

2013年8月から毎日、「そうだったのか」という思いを綴ってきました。

「みんなが、」という言葉に釈然としないとき、「レンガづくりのT定規」を思い浮かべる~正規分布から

マンガ 統計学入門―学びたい人のための最短コース (ブルーバックス)

 本書裏表紙より、「統計学が発展した歴史を追いながら基本的な概念をもれなく解説。」

本書56-66ページとwikiyより整理

二項分布

数学において二項分布は、結果が成功か失敗のいずれかである n 回の独立な試行を行ったときの成功数で表される離散確立分布。

例えばコインを10回投げて表の出る回数を記録したもの。10回投げて表の出るトライを10回やれば5回を中心にばらつく、そのトライの回数を増やせば正規分布に近づく。

正規分布

平均値の付近に集積するようなデータの分布を表した連続的な変数に関する確率分布。釣り鐘をした左右対象の曲線で、負の無限大から正の無限大まで連続している。

正規分布の正規とは?

正規を意味する英語、normalbの語源はラテン語のnorma。れんが職人や大工が直角を出すために使っていたT定規のことです。そこから直角を「ノーマルnormalな角度」と呼ぶようになり、17正規には幾何学でもこの言葉を使うようになります。代数の世界でも1809年に正規曲線について検討したガウスが、18世紀末に「norm」という言葉を導入します。

f:id:kocho-3:20140214063529p:plain(65ページ)

Normという言葉の意味

①normalは平均とか典型的の意味:統計用語として転用され始めた。

②normは倫理的制約=理想の姿:医療分野において19世紀以降使われた

③完全にnormal(平均、典型的)な状態であり、現実には存在しない値:19世紀末から統計用語に意味が付加された。

 

二項分布に戻って倫理的意味を考える。

コイン投げに倫理的意味はあるか?コイン投げで極端な結果、10回投げて10回表がでるのはトライの回数を増やせば必ず生じる。そして10回表の結果に倫理的意味はあるか?

そこには倫理的意味はない,本来の統計用語には倫理的意味は無かった。

二項分布からレンガ職人に戻ってnormの意味を考える

レンガ職人にとって直角が必要な事は理解。でも平行四辺形のレンガは否定できないし、モザイク=複雑系もあり得る。レンガ職人が一番あり得る環境では直角のレンガが便利な事と認識。そこには直角に特別な存在を与える必要はない。

蛇足

統計データは倫理的意味を持たない、レンガのT定規の由来がそれを明らかにする。