こんにちは、かじつとむです。
みなさんは誤差というものはご存知でしょうか?
誤差を考えることはデータを解釈するのにとても重要な要素です。
また、誤差を理解することで統計学での分散分析や回帰分析の理解にもつながります。
今回はそんな誤差について解説します。
この記事を読むことで以下のことがわかります。
- 誤差の意味について理解できる
- 誤差の種類について理解できる
- 誤差によるデータの解釈の仕方について理解できる
それではいってみましょう!
誤差とは
誤差とは、真の値と測定した値の差やずれをいいます。
誤差が検出したい値の範囲よりも大きいと計測した値が正しいかどうか判断できなくなります。
ただし、データをたくさん集めて誤差の特性を評価することで、真の値をある程度予測することができます。
誤差の種類
誤差には2種類あります。
1つ目は計測のたびに変化する誤差です。
この誤差をランダム誤差または偶然誤差といいます。
偶然誤差は同じ人が同じ計測方法で計測しても起こりうる誤差になります。
また、偶然誤差の発生は同じ計測器でも発生するため、計測器の品質の誤差ともとらえることがあります。
もう1つは人や条件によって発生する一定の誤差です。
この誤差をバイアスまたは系統誤差といいます。
たとえばAさんとBさんの測定によって一定で発生した誤差は系統誤差になります。
この他にも場所や気温、時期によって誤差が発生した場合もすべて系統誤差になります。
以上が誤差の種類となります。
続いては偶然誤差と系統誤差の大きさによるデータの解釈について解説します。
誤差によるデータの解釈
測定したデータは、誤差の種類と大きさによって解釈の仕方が変わります。
誤差の種類と大きさによって以下の4パターンの解釈の仕方がありますので、覚えておきましょう!
- 偶然誤差と系統誤差が小さい
- 偶然誤差が大きく系統誤差が小さい
- 偶然誤差が小さく系統誤差が大きい
- 偶然誤差と系統誤差が大きい
偶然誤差と系統誤差がどちらも小さい場合、データは真の値に近いことを示します。
この場合はとくに手を加えなくてもデータは信頼できる値となります。
偶然誤差が大きく系統誤差が小さい場合、データは真の値の近い値ではあるが大きくばらついている状態です。
この場合は計測を繰り返して、その平均値を計算することで真の値に近づけることが可能になります。
偶然誤差が小さく系統誤差が大きい場合、データのばらつきは小さいが真の値からズレている状態となります。
この場合は系統誤差の要因を特定し、その要因を排除するように測定する必要があります。
偶然誤差と系統誤差がどちらも大きい場合、データのばらつきが大きくかつ真の値からズレている状態となります。
この場合は、そもそも測定の仕方が正しかったのか、計測器の品質はどうだったかなどの偶然誤差の要因と、計測結果は何によって変化するのかなどの系統誤差の要因の両方を特定する必要があります。
このような偶然誤差と系統誤差が大きいデータは、何も考えずにデータを取得したり、限定された条件で得たデータの場合が多いです。
以上が誤差によるデータの解釈の仕方になります。
誤差とは 誤差の意味や種類 解釈の仕方まで徹底解説:まとめ
いかがでしたでしょうか?以下まとめです。
- 誤差とは、真の値と測定した値の差やズレ
- 誤差は2種類あり、計測のたびに発生する偶然誤差と人や条件によって一定のズレが発生する系統誤差がある
- 偶然誤差と系統誤差の大きさによって、データの解釈の仕方が変わる
みなさんもぜひデータを誤差という観点で見て、データの解釈を考えてみましょう!
データ分析についてもっと勉強したい方へ
データ分析の基礎について勉強したい方は「分析者のためのデータ解釈学入門 データの本質をとらえる技術」がおすすめです。
この本ではデータやデータ分析の基礎について丁寧に解説している本です。
従来のデータ分析の本とは違い、データの分析方法よりも分析する際の注意点や解釈の仕方にフォーカスした内容となっております。
具体的には、先ほどの誤差の解釈についてやデータの前処理に関する考え方、データ分析から得られた結果の解釈の仕方といった考え方について理解できる内容となっております。
データ分析の基礎知識を理解したい方やデータに関する注意点をおさらいしたい方にはぜひおすすめの1冊となります。
みなさんもぜひデータ分析について興味を持っていただいたら幸いです。
最後までこの記事を読んでいただきありがとうございました!
データ分析やデータサイエンスを動画で学びたい方はこちら!
コメント