coursdirige-tauxinterets/rapport-principalcomponent.tex
2013-11-02 15:47:28 -04:00

101 lines
5.5 KiB
TeX
Executable file

\subsection{Survol de la méthode et utilisation}
La méthode d'analyse de composantes principales est une méthode générale qui vise à identifier différents facteurs qui peuvent causer la volatilité à l'intérieur d'une série chronologique multivariée de taux d'intérêt pour des durations données. Ces composantes peuvent ensuite être représentées dans un modèle à facteurs multiples de la classe affine par exemple. Cependant, cette analyse est particulièrement complexe puisqu'elle implique de modéliser des processus stochastiques sur des espaces non euclidiens. Pour ce rapport, seule la méthode d'identification des composantes sera expliquée, et quelques conclusions pourront en être tirées.\\
\paragraph{Différenciation}
On considère les observations sous la forme $r_{t_i}(\tau_j)$$t_i$ est le temps, de $1$ à $n+1$, et $j$ est le nombre d'observations en coupe transversale (nombre de séries de taux d'intérêt).
Comme on cherche à modéliser la volatilité, on doit alors travailler sur des données différenciées. Nous devons devons d'abord calculer les différences $d_{i,j}$, que nous considérerons comme des observations de la variable aléatoire $d_j$, c'est-à-dire la variable représentant l'intensité des sauts à l'intérieur d'une série.
\begin{eqnarray*}
d_{i,j} = r_{t_{i+1}}(\tau_j) - r_{t_{i}}(\tau_j)
\end{eqnarray*}
\paragraph{Matrice de variance-covariance}
On calcule ensuite la matrice de variance-covariance de ces observations $\Sigma$, qui prend la forme:
\begin{eqnarray*}
\Sigma &=& \left[
\begin{array}{cccc}
var(d_1) & cov(d_1,d_2) & \cdots & cov(d_1,d_k) \\
cov(d_2,d_1)& var(d_2) & \ddots & \vdots \\
\vdots & & \ddots & \vdots \\
cov(d_k,d_1) & \cdots & \cdots & var(d_k) \\
\end{array}\right]
\end{eqnarray*}
On peut aussi calculer la matrice de corrélation correspondante et poursuivre l'analyse avec cette matrice.
\paragraph{Valeurs et vecteurs propres}
On doit maintenant trouver une matrice $\mathbf{P}$ telle que sa transposée est également son inverse.
Cette matrice $\mathbf{P}$ est la matrice de vecteurs propres de $\Sigma$. On a aussi un vecteur $\mathbf{\lambda}$
contenant les valeurs propres de chacun des vecteurs propres (colonnes) de $\mathbf{P}$.
La matrice $\mathbf{P}$ est la matrice de composantes principales et le vecteur $\mathbf{\lambda}$ est le vecteur des variances de chacune des composantes principales, en ordre décroissant. Il est important de noter que les composantes principales sont orthogonales entre elles et donc que la covariance entre chacune d'elles est nulle.
Une fois les composantes principales obtenues, il s'agit ensuite de les visualiser graphiquement pour les interpréter. La littérature affirme que les taux d'intérêts peuvent être expliqués à l'aide des trois premières composantes principales (trois premières colonnes de la matrice $\mathbf{P}$.
\subsection{Analyse empirique}
On utilise pour cette étude empirique les taux composite des bons du trésor américain entre le 3 janvier 1990 et le 15 février 2012, pris à un intervalle quotidien. Les taux considérés ici sont pour les obligations de 90 jours, 2 ans, 3 ans, 5 ans, 10 ans et 30 ans.
Voici les séries utilisées
\includegraphics[scale=0.75]{PCA-tseries.pdf}
\newpage
\subsubsection{Approche avec covariances}
En utilisant l'approche par covariance, nous obtenons la matrice $\mathbf{P}$ de composantes principales suivante:
\input{PCA-Pcov}
et le vecteur de valeurs propres $\mathbf{\lambda}$ suivant:
\input{PCA-lambdacov}
Nous pouvons en déduire que chacune des composantes explique cette proportion de la variance totale:
\input{PCA-prcov}
\newpage
\subsubsection{Approche avec corrélation}
En utilisant l'approche par corrélation, nous obtenons la matrice $\mathbf{P}$ de composantes principales suivante:
\input{PCA-Pcorr}
et le vecteur de valeurs propres $\mathbf{\lambda}$ suivant:
\input{PCA-lambdacorr}
Nous pouvons en déduire que chacune des composantes explique cette proportion de la corrélation totale:
\input{PCA-prcorr}
\subsubsection{Comparaison des deux approches}
\includegraphics[scale=0.75]{PCA-composantes1-2-3.pdf}
On observe sur ce graphique les trois composantes principales pour la méthode avec la covariance et la méthode avec la corrélation. On remarque que les deux méthodes donnent des résultat similaires mais non identiques.
\subsubsection{Volatilité expliquée par composante (score)}
En utilisant des séries chronologiques centrées sur leur moyenne, on peut construire une fonction appelée score qui exprime, pour chaque composante, la proportion de volatilité expliquée, sous forme de série chronologique.
\begin{eqnarray*}
Score(t) &=& r(t) \times \mathbf{P}
\end{eqnarray*}
Pour les deux méthodes utilisées, on obtient les graphiques suivants:
\includegraphics[scale=0.75]{PCA-score.pdf}
\subsection{Conclusion}
Sur les graphiques précédents, on remarque bien que se détachent principalement trois composantes qui expliquent la grande majorité de la variance, est ce tout au long de la série temporelle. Dans la littérature financière, ces composantes sont souvent appelés, dans l'ordre d'importance, Parralel Shift, Tilt et Flex (Curvature). La première est relativement plate et représente les changements qui affectent l'ensemble de la courbe. La seconde explique les variations à court terme, et leur influence inverse sur les variations à long terme, et enfin, la dernière exprime la tendance qu'a la structure à terme à prendre une forme plus ou moins concave.