平方和とは 求め方から意味 活用方法まで徹底解説

基本統計量

こんにちは、かじつとむです。

突然ですが、みなさんは平方和についてご存知でしょうか?

平方和統計学においてとても重要な役割を持っています。
とくに回帰分析分散分析実験計画法といった高度な推測統計学を行う上で重要な統計量なので、ぜひこの機会に勉強しましょう!

この記事を読むことで以下のことがわかります。

  • 平方和とはどのようなものなのか理解できる
  • 平方和の求め方について理解できる
  • 平方和の活用方法について理解できる

それではいってみましょう!

平方和とは

平方和とは、データと平均値の差の2乗の合計の値です。
つまり、平均値からのデータがどれだけズレているのかをあらわす統計量となります。

平均値からデータがどれだけズレているのかは、データから平均値を引くことで出すことができます。しかし、この値は正負が混在しているため、合計しても正しいズレを求めることができません。

そこで、データから平均値を引いた値を2乗してから合計することで、平均値からのズレを正しく求めることができます。これが平方和の正体です。

平方和の概要がわかったところで、次は平方和の求め方について解説します。

平方和の求め方

平方和の求め方は2つあります。

1つは先ほどの定義通り、データの値と平均値の差の2乗の合計を出す方法です。
つまり、データの値を$x_{i}$、データの平均値を$\bar{x}$、データの数を$n$としたとき、平方和$S$は以下の数式であらわすことができます。
$$ 平方和:S = \sum_{i=1}^{n} (x_{i} – \bar{x})^2 $$
ここで$\sum_{i=1}^{n}$は$i=1$から$i=n$まで、それぞれ$\Sigma$のなかにある計算式を計算し、合計するという意味があります。

たとえば、以下のような問題があったとします。

ある高校生4人の身長がそれぞれ、171cm、175cm、168cm、166cmだったとする。
このときの高校生4人の平方和を求めよ。

この場合、まず4人の身長の平均値$\bar{x}$を計算します。
$$データの平均値:\bar{x} = \frac{171 + 175 + 168 + 166}{4} = 170$$
次に先ほど紹介した式を使って平方和$S$を計算します。
$$\begin{eqnarray}
平方和:S &=& \sum_{i=1}^{4} (x_{i} – 170)^2 \\
&=& (171-170)^2 + (175-170)^2 + (168-170)^2 + (166-170)^2 \\
&=& 1^2 + 5^2 + (-2)^2 + (-4)^2 \\
&=& 46
\end{eqnarray}$$
よって、4人の身長の平方和は46と求めることができました。

このように実際に平方和を求める場合は、データの平均値を計算し、それぞれのデータに対する差を求めてから2乗して、最後に合計します。

もう1つの求め方は、データ$x_{i}$とデータの数$n$だけを使って計算する方法です。
その方法は以下の通りになります。
$$ 平方和:S = \sum_{i=1}^{n}x_{i}^2 – \frac{(\sum x_{i})^2}{n} $$
この計算は、データを2乗した値を合計したものから、データの合計値を2乗した値をデータの数で割った値で引くことで、平方和を求めています。

一見すると、最初に紹介した平方和とは違っておりますが、最初の式を展開することでこの式になります。式の証明は以下になります。
$$ \begin{eqnarray}
平方和:S &=& \sum_{i=1}^{n} (x_{i} – \bar{x})^2 \\
&=& \sum x_{i}^2 -2 \bar{x} \sum x_{i} + \bar{x}^2 \sum 1
\end{eqnarray} $$
ここで、$x$の平均値は$x$の合計値をデータの数$n$で割ったものなので以下のようにあらわすことができます。
$$ 平均値:\bar{x} = \frac{1}{n}\sum x_{i} $$
また、$\sum 1$は1を$n$回足し合わせるため、$n$となります。

以上より、平方和$S$は式を変形して
$$ \begin{eqnarray}
平方和:S &=& \sum x_{i}^2 -2 \frac{1}{n}\sum x_{i} \times \sum x_{i} + \frac{1}{n^2} (\sum x_{i})^2 \times n \\
&=& \sum x_{i}^2 – \frac{2}{n} (\sum x_{i})^2 + \frac{1}{n} (\sum x_{i})^2 \\
&=& \sum_{i=1}^{n}x_{i}^2 – \frac{(\sum x_{i})^2}{n} \\
\end{eqnarray} $$
以上より、データの値とデータの数だけで平方和をあらわすことができました。

ではこの式を高校生4人の身長のデータに当てはめてみましょう!

まず4人の身長の合計値は以下のようにあらわします。
$$ データの合計:\sum_{i=1}^{4} x_{i} = 171+175+168+166 = 680 $$
次にデータを2乗した合計も計算します。
$$ データの2乗の合計:\sum_{i=1}^{4} = 171^2 + 175^2 + 168^2 + 166^2 = 115646 $$
この2つの値を平方和$S$の式に代入すると以下のようになります。
$$ \begin{eqnarray}
平方和:S &=& \sum{i=1}^{4}x_{i}^2 -\frac{(\sum x_{i})^2}{4} \\
&=& 115646 – \frac{680^2}{4} \\
&=& 46
\end{eqnarray} $$
最初に計算した値と同じ46となりました。

このように平方和は、データとその数を使うだけでも計算することができます。

以上が平方和の求め方になります。次は平方和の活用方法について解説します。

平方和の活用方法

平方和は主にデータのばらつき具合を考えるときに活用されます。
すなわち、分散を計算するときに使われます。

分散とは、データのばらつき具合をあらわす統計量です。言い換えると、データの平均値に対するズレの平均値とも解釈することができます。

よって一般的な分散$\sigma^2$は平方和$S$とデータの数$n$を使って、以下のように計算できます。
$$ 分散:\sigma^2 = \frac{S}{n} $$
また、分散の中でも点推定で用いられる不偏分散$V$は、平方和$S$をデータの自由度$\phi(=n-1)$で割ることで計算できます。
$$ 不偏分散:V = \frac{S}{\phi} = \frac{S}{n-1} $$
このように平方和は、データのばらつきを計算するために活用されます。

他にも、回帰分析で数値を予測する関数(モデル)を作成するときや分散分析をする際に分散をわけるときに平方和が活用されます。

平方和とは:まとめ

いかがでしたでしょうか?以下まとめです。

  • 平方和とは、平均値からデータがどのくらいズレているのかをあらわす統計量
  • 平方和は、2つの計算方法があり、データとその数がわかれば計算できる
  • 平方和は主に分散を計算するときに活用される。一般的な分散であれば平方和をデータの数で割ることで求めることができる
  • 平方和は、回帰分析のモデル作成や分散分析の際に分散をわけるために活用される

みなさんもぜひ平方和について理解し、より複雑な統計学に活用できるようにしましょう!

より高度な統計学を勉強したい方へ

この記事を読んで、平方和を使った統計学(回帰分析や分散分析)を勉強してみたいと思った方は「入門 統計解析法」がおすすめです。

created by Rinker
¥3,190 (2022/05/28 15:46:12時点 楽天市場調べ-詳細)

この本では、分散や標準偏差などの基本的内容から仮説検定・分散分析・回帰分析といった製造業の現場で実践的に使える統計学について学ぶことができます。

高校数学の内容までの数式を使いますが、実際の製造業で使われる具体例を用いて統計学を解説しておりますので、使い方をイメージできる一冊となります。

特に先ほど紹介した平方和を分散分析や回帰分析に活用している例が記載されております。

数学の知識を持っており、実務で使える本格的な統計学を学びたい方にはぜひおすすめの本です!

created by Rinker
¥3,190 (2022/05/28 15:46:12時点 楽天市場調べ-詳細)

ただしこちらの本が難しいと感じか方は、まずは入門として「完全独習 統計学入門」がおすすめです。

created by Rinker
¥1,980 (2022/05/28 19:27:43時点 楽天市場調べ-詳細)

どちらも統計学を勉強するにはイチオシの本ですので、みなさんもぜひ統計学の勉強しましょう!

最後までこの記事を読んでいただきありがとうございました!

統計学を動画で勉強したい方はこちら!

【ゼロからおさらい】統計学の基礎講座

コメント

タイトルとURLをコピーしました