2014年05月07日

事実にもとづく判断

 事実にもとづく判断は経営においても品質管理においても重要なアプローチです。データを分析して客観的に判断するというものです。私は、品質管理にかかわる初歩的な統計的手法を各社で教えていますが、そこでよく質問を受けるのは、一体どれくらいのデータを集めればよいかということです。この質問の裏には、できるだけデータ数を少なくしたいという思いがあるようです。判断の誤りを少なくするには、データ数は多ければ多いほどよいのですが、多くのデータを集めるだけでも大変な労力がかかります。データ数をできるだけ少なくかつ判断の誤りをできるだけ少なくするのにはどうすればよいでしょうか。

 目的にもよりますが、例えば製造工程のばらつき具合を把握する際にはデータ数n=100以上が望ましいです。さらに異常原因がはたらいていないかどうか管理図を作成しながら監視し、異常原因がはたらいていなければ管理図を作成したデータ(例えばサンプルサイズn=4×25群)を使って判断すればよいです(Rbar/d2)。異常原因がはたらいていて、それが取り除けないようであれば、サンプリングしたすべてのデータを使って標準偏差を算出します(s)。また、n=100あたりになると適用されるt分布が正規分布に限りなく近づくことが分かっています(正規分布の方が精度よく判断できる)。

それでも100個もサンプリングするのはしんどいという声を聞きます。ばらつき具合を見たい時にはQC七つ道具の一つであるヒストグラムを使うのはご存じですよね。まともなヒストグラムを作ろうとすると区間(度数分布を表す棒のこと)の数は、7つくらい欲しいものです。区間の数が7つということは、だいたい50くらいのデータが必要になってきます。なぜなら区間の数はデータ数の平方根にちかい数が適切なことが分かっているので、この場合は7=√49ということでデータ数は50くらいになります。

 以上は製造工程の安定性を見たい時の話でしたが、実験などで最適な製造条件を探りたい時は、そんなにデータを取ることができません。少ないデータで判断するための手法として、検定・推定、実験計画法などがあります。しかし、これらにしても有意差や最適条件の判断などはできても、その条件でのばらつきを把握するためにはデータ数を多くして判断する必要があります。
posted by kobayashi-keiei at 10:18| 日記