平均値を図形で理解しよう
おじさんの趣味は日曜工作である。先日来自宅の居間の隅にある隙間が気になっており、そこにちょうど収まる棚の作成を思い立った。まずは設計だと思い、メジャーを持って隙間の幅を測ってみたのだが、歳のせいか手の震えも手伝って、測るたびに数字がぶれてしまう。一度目は78.1cm、二度目は78.5cm、その次は77.8cmとなった。ううむ、おじさんはこの隙間の本当の幅が知りたい。
測定値は何らかの原因により本当の値の近辺にばらつくものだろうから、すべての測定値との差がなるべく小さくなるような値を見つければ、本当の値とは言えないまでも、それに近い値が得られるはずだ。そのような値をとすると、この値をいろいろと変えてみて測定値との誤差の合計がなるべく小さくなるような値を探せば良いのではないか。だが誤差をそのまま合計をとるとが負の無限大となって工作が不可能になる。これを避けるために誤差の二乗和を最小にするとするのが良さそうだ。そのようなを見つけるにはどうすればいいだろう。
誤差の二乗和は2次関数なので、高校の数学で習った極値問題とみなし、微分して0になる値として求めるのが定石だろうが、図形的に求めることはできないだろうか。はN次元空間における点と点の距離と捉えることもできる。この距離を図で表現するため、1つ目の測定を軸、2つ目の測定を軸とする、の2次元空間で考えてみよう。
上の図で測定値は点で表されている。の値は本当の値であり、測定するたびに変化することはないのだから、この図における点は軸と軸の値が同じになる点、つまりの線上のどこかにあるはずだ。その何処かにある点と点の距離が最小になるためには、とを結ぶ線が線と直角に交わることが必要だ。ということは原点ととを結んだ線が直角三角形になるということだ。一般に原点と点の距離はなので次の式がなりたち、これを整理すると測定値がN個あったとすると、N次元空間で同様な議論がなりたち、これを整理すると
となって、mの値が求まった。これは学校で習った平均値を求める式と同じだ。つまりおじさんが探していたmとはいわゆる平均値のことであった。