starwish’s diary

おじさんの自由研究

平均値を図形で理解しよう

おじさんの趣味は日曜工作である。先日来自宅の居間の隅にある隙間が気になっており、そこにちょうど収まる棚の作成を思い立った。まずは設計だと思い、メジャーを持って隙間の幅を測ってみたのだが、歳のせいか手の震えも手伝って、測るたびに数字がぶれてしまう。一度目は78.1cm、二度目は78.5cm、その次は77.8cmとなった。ううむ、おじさんはこの隙間の本当の幅が知りたい。
測定値は何らかの原因により本当の値の近辺にばらつくものだろうから、すべての測定値との差がなるべく小さくなるような値を見つければ、本当の値とは言えないまでも、それに近い値が得られるはずだ。そのような値をmとすると、この値をいろいろと変えてみて測定値xとの誤差(x_n-m)の合計がなるべく小さくなるような値を探せば良いのではないか。だが誤差をそのまま合計をとるとmが負の無限大となって工作が不可能になる。これを避けるために誤差の二乗和\sum_n^N{(x_n-m)^2}を最小にするmとするのが良さそうだ。そのようなmを見つけるにはどうすればいいだろう。
誤差の二乗和は2次関数なので、高校の数学で習った極値問題とみなし、微分して0になる値として求めるのが定石だろうが、図形的に求めることはできないだろうか。\sum_n^N{(x_n-m)^2}はN次元空間における点\textbf{x}=(x_1,...,x_N)と点\textbf{m}=(m,...,m)の距離と捉えることもできる。この距離を図で表現するため、1つ目の測定をX_1軸、2つ目の測定をX_2軸とする、X_1X_2の2次元空間で考えてみよう。

上の図で測定値は点x(x_1,x_2)で表されている。mの値は本当の値であり、測定するたびに変化することはないのだから、この図における点mX_1軸とX_2軸の値が同じになる点、つまりX_1=X_2の線上のどこかにあるはずだ。その何処かにある点mと点xの距離が最小になるためには、mxを結ぶ線が線X_1=X_2と直角に交わることが必要だ。ということは原点とxmを結んだ線が直角三角形になるということだ。一般に原点と点(x,y)の距離はx^2+y^2なので次の式がなりたち、
{x_1}^2+{x_2}^2=m^2+m^2+(m-x_1)^2+(m-x_2)^2
これを整理すると
m=\displaystyle\frac{x_1+x_2}{2}
測定値がN個あったとすると、N次元空間で同様な議論がなりたち、
\sum_n^N{{x_n}^2}=m^2+m^2+\sum_n^N{(m-x_n)^2}
これを整理すると

m=\displaystyle\frac{\sum_n^N{x_n}}{N}

となって、mの値が求まった。これは学校で習った平均値を求める式と同じだ。つまりおじさんが探していたmとはいわゆる平均値のことであった。