統計検定で学ぶ線形代数
この記事は、「日曜数学Advent Calendar 2019」の15日目の記事です。
昨日14日目の記事は龍孫江さんの「あるUFD上の形式冪級数環について」でした。
本文
今年は、11月に受けた統計検定1級の問題を紹介してみようかと思います。
統計の基礎的な知識(期待値と分散の計算方法のみ)は必要なものの、「そらあんた線形代数ですやん」と言いそうになる問題がありました。
以下の「経緯」については、自分が統計に手を染めてしまった経緯を書いているだけなので、特に読まなくて大丈夫です。
経緯
昨年度は、Deep Learningに手を出し、東大の松尾研の講座を修了しました。 deeplearning.jp
個人的な最終目標は、「特許請求の範囲に基づく権利範囲の正確な認識を機械的に行う」という感じなのですが、自然言語の意味理解に迫る話なので、まあそれは難し過ぎるということで保留にしています。大量の連続量データの雑なクラスタリングにはDeep Learningが向いているのですが、特許文献のような文書形式も手続きもルール化されたものを扱うなら、まずは統計解析から始めたらええやんかということで、今年の9月頃から統計に手を染め始めました。
統計の勉強をどのように行うのか迷いましたが、根っからの受験屋タイプの自分には問題を解いて理解するのが一番向いているということで、小寺平治の数理統計や、すうがくぶんかさんの個人指導で統計検定1級対策の問題を解いたりしていました。
https://sugakubunka.com/toukei-kentei_seminar-1/
まあ、そんなことより、今年の問題を見ていきましょう。
2019年 統計検定1級 統計応用 理工学 第4問
問題については、もう少ししたら以下の公式サイトにアップされると思います。
時系列データ は一次の自己回帰()モデル
() (1)
に従うとする。ここでは互いに独立にに従う確率変動項であり、定常性の条件 < 1を仮定する。 につき以下の各問に答えよ。
問題[1]
モデル(1)における の自己共分散行列の各成分は
で与えられ、自己相関行列はとなることを示せ
[1]の回答
(1)の期待値をとると、であることより、
となるが、 なのでである。
ところで、 なので、とおくと、となり、となる。
ここで、のとき、
となり、ここで(1)より、
となる。
さらに、i>jも同様に、となる。
よって、であり、である。
問題[2]
n次対称行列を
とする。たとえばでは
である。一般のおよび上問[1]の行列Tに対し、の逆行列はで与えられることを示せ。また、の行列式およびの行列式の値を求めよ。
[2]の回答
の成分をとかくと、である。
これを計算すると、対角要素が1、それ以外が0となるので確かめて欲しい。(割愛)
の行目を倍して行目に足すということをから順番に行った行列は以下のようになる。
の列目を倍して列目に足すということをから順番に行った行列は以下のようになる。
上記の操作によって行列式は不変なので、となる。
となるので、
問題[3]
を次ベクトルとしたとき、問題[2]の行列に関する2次形式をを用いて書き下し、<1のとき、はすべてのに対して、常に正であること、すなわちは正定値であることを示せ。
[3]の回答
問題[4]
問題[2]の行列の要素の1のみをに変えた行列をとする。一般のについて、に関する2次形式はすべてのに対しての値によらず非負となること、すなわちは非負定値であることを示せ。また、となる(ただし、はどのようなベクトルであるか。
[4]の回答
等号成立は、となる任意のに対して、であるとき。
あとがき
今回は最近手を染めている統計検定に現れた線形代数について紹介し、実際に問題を解くという形でご紹介いたしました。
日曜数学と日曜数学アドベントカレンダー2019は、まだまだ続きますので引き続きお楽しみに!