次に「変動係数」を用いて、男性の平均体重60kgとラットの平均体重0. 44kgに対する相対的なばらつきの大きさを算出してみます。 017• ラットの体重の変動係数:0. 227 この結果から、平均体重に対してはラットの体重の方が相対的にばらつきが大きいということが分かります。 【コラム】変動係数を使うコツ 変動係数は、平均値に対して標準偏差が比例関係にあるものに対して適用するのが正しい使い方です。 すなわち、の場合に有効な指標であり、では参考になりません。 この章の例題2の男性とマウスの体重の測定結果のように、平均値が大きくなればその分ばらつきも大きくなっていくようなデータに対して正しい評価を行うことができます。 他にも、実験データにおける計量の正確さ比較する場合にも変動係数が用いられることがあります。 変動係数が小さいほど、測定の精度が高いことを意味します。 例えばでは、が示した水質基準項目の物質それぞれについて、測定精度が変動係数によって示されています。
次の
次に「変動係数」を用いて、男性の平均体重60kgとラットの平均体重0. 44kgに対する相対的なばらつきの大きさを算出してみます。 017• ラットの体重の変動係数:0. 227 この結果から、平均体重に対してはラットの体重の方が相対的にばらつきが大きいということが分かります。 【コラム】変動係数を使うコツ 変動係数は、平均値に対して標準偏差が比例関係にあるものに対して適用するのが正しい使い方です。 すなわち、の場合に有効な指標であり、では参考になりません。 この章の例題2の男性とマウスの体重の測定結果のように、平均値が大きくなればその分ばらつきも大きくなっていくようなデータに対して正しい評価を行うことができます。 他にも、実験データにおける計量の正確さ比較する場合にも変動係数が用いられることがあります。 変動係数が小さいほど、測定の精度が高いことを意味します。 例えばでは、が示した水質基準項目の物質それぞれについて、測定精度が変動係数によって示されています。
次の
今回は変動係数、相関係数、偏相関係数についての記事です. 最後に簡単なプログラムをpythonで書いたのでそちらも載せておきます. 変動係数 標準偏差の他にデータの散らばり具合を測る指標を紹介します. 標準偏差について知りたい方は下の記事も参照してください. さて、例えばセンター試験の英語 200点満点 と学校の小テスト 30点満点 の平均と標準偏差が以下のように得られたとします. 平均や標準偏差は適当に設定しています. しかし、 学校の小テストは30点満点なのでセンター試験の英語に比べて値が散らばらないのは当然です. これは平均が大きく異なることに起因します. したがって、 平均が大きく異なるデータ群同士の散らばり具合を比較した時には単純に標準偏差の比較では間違った解釈となってしまいます. そこで用いられる指標が 変動係数 CV, coefficient of variation です. 変動係数は次のように定義されます. 標準偏差を平均で標準化することにより異なる平均同士でも比較することができます. 平均に対して標準偏差がどの程度になるかを算出していることに等しいです. 変動係数を用いると、• センター試験の英語における変動係数 :• 学校の小テストにおける変動係数 : となるので、 標準偏差の大小関係と逆になっていることが確認できます. 相関係数 例えば、経験的に駅の近さと家賃は関係していると考えられます. 駅から遠いほど家賃が高く、遠いほど家賃が安い このように 2つの変数がどのような関係にあるかを知りたい時があります. また、 このような互いの関係のことを 相関 correlation と呼びます. 今、 駅までの所要時間、家賃)のデータを とします. このデータの駅までの所要時間を 、家賃を とし、二次平面上にプロットすることを考えます. この時できた図を 散布図 scatter diagram と呼びます. 上の駅までの所要時間と家賃の関係をプロットした散布図を以下に示します. 散布図を見ると、駅から近い物件ほど家賃が安い傾向にあることがわかります. このように 片方の変数が大きくなるともう片方の変数が小さくなることを、 負の相関があると呼びます. 逆に 片方の変数が大きくなると、もう片方も大きくなる関係のことを、 正の相関があると呼びます. そのどちらでもないものを 無相関と呼びます. また、相関にもはっきりと正または負の関係が現れているものとそうでないものがあります. 前者を 強い相関、後者を 弱い相関と呼びます. この強い相関、弱い相関を表す指標が 相関係数です. 散布図やその他の表では視覚的に考察できましたが、定量的な評価には向いていませんでした. そこで、 相関係数を用いて定量的な評価をすることを考えます. 相関係数を求めるためには、 共分散が必要なので、まず共分散について説明します. 共分散 2変数データ が与えられたとします. このとき共分散は以下で定義されます. 逆に のときは、どちらかが平均より大きくもう片方が小さいか、その逆となります. これらを全ての観測値に対して計算し平均をとったものが共分散となります. 相関係数に話を戻します 共分散が 正の値を取るならば、 正の相関が、 負の値を取るならば 負の相関があることがわかります. しかし、 共分散は単位によって大きさが異なるため、2つの標準偏差で割ります. 2つの標準偏差で割ることで、相関係数の値は単位によらず、-1から1の間の値を取ることになります. 偏相関係数 相関がそんなに強くなくても上の相関係数の絶対値が大きくなることがあります. 例えば、ある県における各市の喫茶店の数とゲームセンターの数の2変数について考えます. このとき、相関係数を計算すると0. 86となったとします. 86は十分強い相関であると言えますが、経験的に喫茶店の数とゲームセンターの数の間に直接強い相関があるようには思えません. これは、人口密度という第三の変数が、喫茶店の数とゲームセンターの数のそれぞれと強い相関があるため、 見かけ上の相関が生じた可能性があります. 第3の変数によって現れる2変数の相関を見かけ上の相関と呼びます. ここで、 喫茶店の数、 ゲームセンターの数、 人口密度の数とし、それぞれの相関係数を以下のように得られたとします. 喫茶店の数とゲームセンターの数 0. 喫茶店の数と人口密度 0. ゲームセンターの数と人口密度 0. 98 ここで、考えるのは、 喫茶店の数とゲームセンターの数の間に強い相関があるように見えたのは、人口密度が影響していると考え、人口密度の影響を覗いた後の喫茶店の数とゲームセンターの数の間の相関を考えます. この第3の変数の影響を取り除いた後の2変数の相関係数を 偏相関係数 partial correlation coefficient と呼び、 と書きます. 偏相関係数は以下のように定義されます. 80 - 0. 実装例 最後に簡単ではありますが、pythonで書いたプログラムを載せておきます. 39, 0. 72, 1. 00, 1. 52, 5. 20, 9. 54, 19. 19, 30. 24, 0. 62, 1. 00, 1. 88, 11. 86, 29. 46, 84. 01, 164. linearml.
次の