[前][次][番号順一覧][スレッド一覧]

mysql:10164

From: 渡邊昌之 <渡邊昌之 <mark@xxxxxxxxxx>>
Date: Wed, 15 Sep 2004 17:28:18 +0900
Subject: [mysql 10164] Re: 標準偏差値が違う

渡邊と申します。

不偏分散ってのを調べてみました。
波多様ありがとうございます。

波多様のおっしゃるとおり、Mysqlはデータをサンプルとは思わず
母集団全体だと思って標準偏差を計算している為、標準偏差の定義通りの
値を返している訳ですね。

で、Excelや通常使われる標準偏差というのは、データをサンプルと考えて
元の母集団の標準偏差を出そうとしている・・・
ということで、式の違いだけを吸収するなら
stddev(num)*sqrt(count(num)/(count(num)-1)) 
で出てきますね。
とりあえず数が多ければ誤差の範囲ですか

今取ろうとしているデータが全データであって、推定する必要が無い
テストの成績とか
の場合はこんな小細工はせず、単にstddevを取った方が正しいわけですね。

データがサンプルである場合
アンケート結果とか、実験結果とか
の場合は上記の小細工を入れた方が正解に近いということでしょうか。

なんか間違っているような気もするけど、もし間違ってたら
どなたか訂正お願いします。

PQ6A-TSMT@xxxxxxxxxx (Toshimitsu Akihiko) wrote:

> 
> 解決方法はわからないのですが、
> 
> mysqlのマニュアルだと、
> http://dev.mysql.com/doc/mysql/ja/GROUP-BY-Functions.html
> >>VARIANCE(expr)
> >>    expr の標準偏差を返す
> >>(レコードはサンプルではなく、母集団全体とみなされる。
> >>そのため、この関数はレコード数を分母として取る)。
> >>これは SQL-99 に対する拡張(バージョン 4.1 以降で使用可能)。
> 
> でExcelの関数ですと
> http://www2.odn.ne.jp/excel/function.html
> 
> >>STDEV:母集団の標本を使って標準偏差を返します。
> >>STDEVP:母集団全体を対象に標準偏差を返します。
> 
> ExcelでSTDEVPで計算すると11.7047になりませんか?
> 
> 
> >芦田と申します。
> >
> >よろしくお願いします。
> >
> >MySQLで用意されているグループ関数で標準偏差を計算するSTDDEV関数を
> >使用した結果と、Excelの分析ツールで計算した結果が違うのですが
> >どうしてでしょう?
> >Webで公開されている解析ツール等で標準偏差を確認しても、Excelでの
> >計算結果とは一致するのですが、MySQLでの結果が違います。(>_<)
> >
> >原因がわかる方よろしくお願いします。 m(__)m
> >

_______________________________________
渡邊昌之
mark@xxxxxxxxxx
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

[前][次][番号順一覧][スレッド一覧]

     10163 2004-09-15 16:42 [<PQ6A-TSMT@xxxxxxxxx] Re: $BI8=`JP:9CM$,0c$&amp;(B          
->   10164 2004-09-15 17:28 ┗[渡邊昌之 <mark@xxxxx] Re: 標準偏差値が違う