onewanのメモ帳

数式が書きたくて始めたブログ。twitter IDは @onewan

統計検定で学ぶ線形代数

この記事は、「日曜数学Advent Calendar 2019」の15日目の記事です。

adventar.org

昨日14日目の記事は龍孫江さんの「あるUFD上の形式冪級数環について」でした。

blog.livedoor.jp

本文

今年は、11月に受けた統計検定1級の問題を紹介してみようかと思います。

統計の基礎的な知識(期待値と分散の計算方法のみ)は必要なものの、「そらあんた線形代数ですやん」と言いそうになる問題がありました。

以下の「経緯」については、自分が統計に手を染めてしまった経緯を書いているだけなので、特に読まなくて大丈夫です。

経緯

昨年度は、Deep Learningに手を出し、東大の松尾研の講座を修了しました。 deeplearning.jp

個人的な最終目標は、「特許請求の範囲に基づく権利範囲の正確な認識を機械的に行う」という感じなのですが、自然言語の意味理解に迫る話なので、まあそれは難し過ぎるということで保留にしています。大量の連続量データの雑なクラスタリングにはDeep Learningが向いているのですが、特許文献のような文書形式も手続きもルール化されたものを扱うなら、まずは統計解析から始めたらええやんかということで、今年の9月頃から統計に手を染め始めました。

統計の勉強をどのように行うのか迷いましたが、根っからの受験屋タイプの自分には問題を解いて理解するのが一番向いているということで、小寺平治の数理統計や、すうがくぶんかさんの個人指導で統計検定1級対策の問題を解いたりしていました。

www.kyoritsu-pub.co.jp

https://sugakubunka.com/toukei-kentei_seminar-1/

まあ、そんなことより、今年の問題を見ていきましょう。

2019年 統計検定1級 統計応用 理工学 第4問

問題については、もう少ししたら以下の公式サイトにアップされると思います。

www.toukei-kentei.jp

時系列データ ( \ldots , X_{-1} , X_0 , X_1 , \ldots , X_n , \ldots ) は一次の自己回帰( AR(1))モデル

 X_t = \phi X_{t-1} + \epsilon_t ( t= \ldots , -1, 0. 1, \ldots ) (1)
に従うとする。ここで \epsilon_t は互いに独立に N ( 0, \sigma ^2 )に従う確率変動項であり、定常性の条件 | \phi | < 1を仮定する。 (X_1, \ldots , X_n) につき以下の各問に答えよ。

問題[1]

モデル(1)における (X_1, \ldots , X_n) の自己共分散行列 T= { \tau_{ij} }の各成分は

 \tau_{i j} = \frac{\sigma ^2}{1-\phi ^2} \phi^{|i-j|}  (i,j=1, \ldots , n)

で与えられ、自己相関行列は R={ \rho_{ij}  } = { \phi^{|i-j|} }となることを示せ

[1]の回答

(1)の期待値をとると、 \epsilon_t ~ N (0, \sigma^2)であることより、

 E [ X_t ] = E [ \phi X_{t-1} ] + E [ \epsilon_t ] = \phi E [ X_{t-1} ] となるが、 \phi \ne 1 なので E [ X_t ] = E [ X_{t-1} ] = 0である。

ところで、  E [ X_t^2 ] = E [ \phi^2 X_{t-1}^2 + 2 \phi X_{t-1} \epsilon_t + \epsilon_t^2 ] = \phi E [X_{t-1}^2 ] + \sigma^2なので、 E [ X_t^2 ] = E [ X_{t-1}^2 ] = Vとおくと、 V = \phi^2 V + \sigma^2となり、 V= \frac{\sigma^2}{1-\phi^2}となる。

ここで、 i \le jのとき、

 \tau_{ij} = E[ X_i X_j ] - E[ X_i ] E [ X_j ]= E[ X_i X_j ] となり、ここで(1)より、
 = E[ X_i  ( \phi X_{j-1} + \epsilon_t ] = \phi E [ X_i X_{j-1}] + E [ X_i \epsilon_t ]= \phi E [ X_i X_{j-1}] = \phi^{j-i} E [ X_i^2] = \frac{\sigma^2}{1-\phi^2} \phi^{j-i} となる。

さらに、i>jも同様に、 \tau_{ij} =  \frac{\sigma^2}{1-\phi^2} \phi^{i-j} となる。

よって、 \tau_{ij} =  \frac{\sigma^2}{1-\phi^2} \phi^{|i-j|} であり、 \rho_{ij} = \frac{\tau_{ij}}{\sqrt{V} \sqrt{V}}=\phi^{|i-j|}である。

問題[2]

n次対称行列 A = \{ a_{ij} \}

{\displaystyle 
a_{ij} = \begin{eqnarray}
  \left\{
    \begin{array}{cc}
1 & (i=j=1,i=j=n) \\
 1+\phi^2 & (i=j=2, \ldots , n-1) \\
 - \phi & (|i-j|=1) \\
 0 & (|i-j| \ge 2)
    \end{array}
  \right.
\end{eqnarray}
}

とする。たとえば n=4では

{\displaystyle 
  A =
    \begin{pmatrix}
      1 & - \phi & 0 & 0\\
     - \phi & 1+ \phi^2 & - \phi & 0\\
      0 & - \phi & 1+ \phi^2 & - \phi \\
      0 & 0 & - \phi & 1
    \end{pmatrix}
}

である。一般のnおよび上問[1]の行列Tに対し、 \frac{1}{\sigma^2} T逆行列 Aで与えられることを示せ。また、A行列式 |A|およびR行列式|R|の値を求めよ。

[2]の回答

 \frac{1}{\sigma^2} T Aij成分を e_{ij}とかくと、 e_{ij} = \displaystyle \sum_{k=1}^n  \frac{1}{1-\phi^2} \phi^{|i-k|} a_{kj} である。

これを計算すると、対角要素が1、それ以外が0となるので確かめて欲しい。(割愛)

{\displaystyle 
  A =
    \begin{pmatrix}
      1 & - \phi & 0 & \cdots & 0& 0\\
     - \phi & 1+ \phi^2 & - \phi & \cdots & 0& 0\\
      0 & - \phi & 1+ \phi^2 & - \phi &\cdots & 0\\
      \  & \  & \ddots & \  & \  & \  \\
      0 & 0 & \cdots &- \phi & 1+ \phi^2 & - \phi \\
      0 & 0 & \cdots & 0 &  - \phi & 1
    \end{pmatrix}
}

Ak行目(k=1,2,\cdots , n-1)\phi倍してk+1行目に足すということをk=1から順番に行った行列A'は以下のようになる。

{\displaystyle 
A'=
    \begin{pmatrix}
      1 & - \phi & 0 & \cdots & 0& 0\\
     0 & 1 & - \phi & \cdots & 0& 0\\
      0 & 0 & 1 & - \phi &\cdots & 0\\
      \  & \  & \ddots & \  & \  & \  \\
      0 & 0 & \cdots & 0 & 1 & - \phi \\
      0 & 0 & \cdots & 0 &  0 & 1 - \phi^2
    \end{pmatrix}
}

A'h列目(h=1,2,\cdots , n-1)\phi倍してh+1列目に足すということをh=1から順番に行った行列A''は以下のようになる。

{\displaystyle 
A''=
    \begin{pmatrix}
      1 & 0 & 0 & \cdots & 0& 0\\
     0 & 1 & 0& \cdots & 0& 0\\
      0 & 0 & 1 & 0 &\cdots & 0\\
      \  & \  & \ddots & \  & \  & \  \\
      0 & 0 & \cdots & 0 & 1 &0 \\
      0 & 0 & \cdots & 0 &  0 & 1 - \phi^2
    \end{pmatrix}
}

上記の操作によって行列式は不変なので、 det(A)=det(A')=det(A'')=1-\phi^2となる。

 
    \begin{eqnarray}
1 &=& det(I_n)=det(\frac{1}{\sigma^2}TA) = det(\frac{1}{\sigma^2}T)det(A)=(1-\phi^2)det(\frac{1}{\sigma^2}T) \\
&=&(1-\phi^2)det(\frac{(1-\phi^2)}{\sigma^2}T)/(1-\phi^2)^n =(1-\phi^2)det(R)/(1-\phi^2)^n \\
&=&det(R)/(1-\phi^2)^{n-1}
    \end{eqnarray}

となるので、 det(R)=  (1 - \phi^2)^{n-1}

問題[3]

 {\bf  x}=(x_1, \ldots , x_n)^T n次ベクトルとしたとき、問題[2]の行列Aに関する2次形式 Q_A = {\bf x}^T A {\bf x} x_1 , \ldots , x_nを用いて書き下し、 |\phi|<1のとき、 Q_Aはすべての {\bf x} \ne {\bf 0}に対して、常に正であること、すなわちAは正定値であることを示せ。

[3]の回答

 
    \begin{eqnarray}
 {\bf x}^T A {\bf x} &=& x_1^2+x_n^2+(1+\phi^2) \sum_{k=2}^{n-1} x_k^2 - 2 \phi \sum_{k=1}^{n-1} x_k x_{k+1} \\
 &=& \sum_{k=1}^{n-1} ((x_k - \phi x_{k+1})^2 + (1+ \phi^2) x_{k+1}^2 )\\
 &>&0
    \end{eqnarray}

問題[4]

問題[2]の行列A(1,1)要素の1のみを \phi^2に変えた行列をBとする。一般のnについて、Bに関する2次形式 Q_B = {\bf x}^T B {\bf x}はすべての{\bf x}に対して\phiの値によらず非負となること、すなわちBは非負定値であることを示せ。また、 Q_B=0となる {\bf x}(ただし、 {\bf x} \ne {\bf 0}はどのようなベクトルであるか。

[4]の回答

 
    \begin{eqnarray}
 {\bf x}^T B {\bf x} &=& \phi^2 x_1^2+x_n^2+(1+\phi^2) \sum_{k=2}^{n-1} x_k^2 - 2 \phi \sum_{k=1}^{n-1} x_k x_{k+1} \\
 &=& \sum_{k=1}^{n-1} (\phi x_k -  x_{k+1})^2  \\
 &\ge&0
    \end{eqnarray}

等号成立は、 k=1, \ldots , n-1となる任意のkに対して、 x_{k+1}= \phi x_kであるとき。

あとがき

今回は最近手を染めている統計検定に現れた線形代数について紹介し、実際に問題を解くという形でご紹介いたしました。

日曜数学と日曜数学アドベントカレンダー2019は、まだまだ続きますので引き続きお楽しみに!