確率計算0.2 確率分布の代表指標
確率分布に関する代表指標を載せてあります。
1 平均値(mean)
相加平均または算術平均(arithmetic mean)です。期待値ともいいます。Σn*P(n)で計算できます。
一般的に、確率分野では期待値、統計分野では平均値を使います。
分布グラフはちょうど平均の位置で左右が釣り合う、すなわち重心に当たります。
平均値は数理的に扱いやすいため様々な場面でよく使われます。
分布形の山が左右対称の形から大きく離れると、平均は代表値としては適さない場合が出て、不都合な場合があります。
データを対数変換したものの平均を指数変換で戻した値である相乗平均(幾何平均ともいう)や、データの逆数(1/x=x-1)の平均を逆数にした値の調和平均もあります。
2 中央値(median)
中位値,中位数,メディアン等とよばれます。
この値を中心として、左右の分布の累計が同じしなる値です。
分布形の山が左右対称の形から離れると、平均値とは大きく異なってきます。
3 最頻値(mode)
分布の最大値での変数値です。並み値,モードとも呼ばれます。
分布に山がなく平坦な場合には、最頻値は代表値としてあまり意味をなしません。
平均値より左側に最頻値を持つ連続な単峰性分布では、最頻値<中央値<平均値となります。
経験則として、平均値から最頻値の方に3分の1ほどのところに中央値があります。
これをカール・ピアソンの経験則と呼びます。
正規分布に近いやや非対称の分布に適用される法則です。
1 分散 (variance)
平均との差を2乗和です。Σ(n-平均値)^2*P(n)計算できます。
2乗和はバラツキを表すのに最も適したものであります。
分布全体を左右に平行移動しても分散値は変わりません。
2 標準偏差(standard deviation)
分散の非負の平方根です。変数と同じ次元(同じ単位)を持ちますので.標準偏差は平均値からのバラツキの距離の平均といえます。
3 変動係数(coefficient of variation)
標準偏差を平均値で割ったもの。
変動係数は平均値に占める標準偏差の割合で無次元量となるため、異なる分布間での相対的な変動の比較に用いられます。
4 四分位範囲(Inter Quartile Range)
累計確率が25%となる変数値を第1四分位値、累計確率が75%となる変数値を第3四分位値といいます。
第2四分位値は1.2の中央値のことです。
第3四分位値-第1四分位値を四分位範囲と呼びます。中央値から左右25%、即ち50%が分布する範囲です。
50%という切れの良い値なので、感覚的に標準偏差よりはわかり易い値です。
5 四分位範囲変動係数(coefficient of Inter Quartile Range)
四分位範囲を中央値で割ったものと定義します。
1 歪度(skewness)
確率分布における分布の歪み、左右対称性の指標、分布の山の裾野が伸びている方向とその度合いを表ます。
歪度=Σ(n-平均値)^3*P(n)/標準偏差^3
左右完全に同じだと歪度は0、平均値より左にピークがあればプラス、平均値より右にピークがあればマイナスの値となります。
対称からのズレが大きいほど大きな値となります。
正規分布は左右対称ですので歪度は0です。
二項分布の歪度は(1-2p)/(np(1-p))^0.5です。
2 尖度 (kurtosis)
確率分布における分布の尖り、扁平性の指標、分布の山の裾野の分厚さの度合いを表す。
歪度=Σ(n-平均値)^4*P(n)/標準偏差^4-3
分布の左右対称からのずれを表わします。
-3は正規分布の突度を0とするためのものです。
正の値は正規分布より尖っています。
負の場合は正規分布より平坦です。
二項分布の尖度は(1-6p(1-p))/(np(1-p))です。
【広告】
« 確率計算0.1 確率分布 | トップページ | 確率計算4.2 トータル確率 »
コメント