On considère une variable continue aléatoire $x$ sur $]-\infty ,+\infty [$ suivant une loi de Gauss de paramètre $\mu $
et $\sigma $. -Donnez l’expression de la loi de Gauss. -Donnez les conditions pour que cette loi soit une pdf ainsi que sur les paramètres. -Quelle est la fonction caractéristique (définition générale et expression dans ce
cas). -Faites de même pour sa fonction cumulative.
\begin{equation}
\Longrightarrow
\Phi(t)=\dfrac{1}{\sqrt{\pi}}\,e^{it\mu}\,{\large\int}_{-\infty}^{+\infty}\,e^{-X^{2}}\,e^{it\sqrt{2}\sigma\,X}dX
\end{equation}
On se sert de l’égalité suivante, elle peut être trouvée sur le Web:
On fait un changement de variable $y=exp(x)$, où $x$ est défini plus haut et suit la loi de Gauss
ci-dessus. -Comment va-t-on calculer la loi de probabilité pour $y$? -Donnez l’expression de la pdf de $y$. -Calculez l’espérance mathématique $E(y)$; donnez d’abord sa définition -Donnez l’expression de la variance de $y$.
Correction:
On doit trouver la densité de probabilités de y notée g(y). On a:
On dispose d’un ensemble de variables $x_{i},i=1,....,n$, et on considère dans le cas le plus général, la
variable aléatoire $z=\sum _{i=1}^{n}a_{i}x_{i}$ où les $a_{i}$ sont des constantes. -Donnez l’expression de l’espérance mathématique $E(z)$. -Donnez l’expression de la variance $V(z)$ (cas le plus général).
$u$et $v$ ne sont pas corrélées. La conclusion est que l’on peut fabriquer deux variables non
corrélées à partir de deux variables corrélées
Exercice 2.2:
Ces deux variables aléatoires $x$ et $y$ suivent une loi de Gauss (pdf $f(x,y)$) avec $\mu _{x}=0$ et $\mu _{y}=0$. * Donnez son expression. * Donnez les espérances mathématiques $E(x)$ et $E(y)$. * Calculez la loi de densité de probabilités pour les variables u et v (pdf $h(u,v)$). * Que concluez-vous pour ces 2 variables aléatoires $u$ et $v$?
Correction:
Formule générale de la fonction de densité de la loi normale à deux dimensions:
Comme on a d’après l’exercice 2.1: $\sigma _{x}^{2}(1+\rho _{xy})=\dfrac {\sigma _{u}^{2}}{2}$ et $\sigma _{x}^{2}(1-\rho _{xy})=\dfrac {\sigma _{v}^{2}}{2}$
On a donc $u$ et $v$ qui sont indépendantes car il y a factorisation de $\text{pdf}(u,v)=\text {pdf(}u\text {)} \cdot \text {pdf}(v)$. Si deux variables X et Y
sont statistiquement indépendantes, alors elles sont non corrélées. L’inverse n’est pas
nécessairement vrai. En effet, la non-corrélation implique l’indépendance que dans des
cas particuliers et le cas des variables aléatoires gaussiennes en fait partie.
Exercice 3.1:
On considère une variable continue $t$ positive, distribuée suivant une loi exponentielle $\propto exp(-t/\tau )$:
Donnez l’expression de la pdf $f(t)$ et calculez l’espérance mathématique $E(t)$ et la variance $V(t)$. On
dispose de $N$ mesures $t_{i}$ de cette variable. On choisit la méthode du maximum de
vraisemblance pour la détermination du paramètre $\tau $. Rappelez le principe de la méthode
et comment vous allez calculer ce paramètre et sa variance. Calculez par la
méthode du maximum de vraisemblance l’estimation de $\tau $ et sa variance. On
dispose de deux échantillons indépendants constitués de $N_{1}$ et $N_{2}$ mesures, de sorte que
l’échantillon total contient $N=N_{1}+N_{2}$ mesures. Calculez l’estimation de $\tau $ à partir de ces $N$
mesures en faisant apparaître les deux contributions $\tau _{1}$ et $\tau _{2}$ des sous-échantillons $N_{1}$ et
$N_{2}$.
Correction:
Soit $t$ une variable aléatoire $> 0$ suivant une loi exponentielle, la pdf s’écrit:
Nous avons N mesures $t_{i}, i=1,..,N$. La méthode du maximum de vraisemblance consiste à determiner
l’estimateur $\tau $ qui est solution de la maximisation ou minimisation de la fonction de
vraisemblance $L$ définie ainsi:
Ce résultat est la moyenne pondérée des deux échantillons.
Exercice 3.2:
Deux expériences indépendantes ont mesuré ($\tau _{1},\sigma _{1}$) et ($\tau _{2},\sigma _{2}$) les $\sigma _{i}$ représentant l’erreur sur les deux
mesures.
(1) A partir de ces deux mesures, en supposant les erreurs gaussiennes, on veut obtenir
l’estimation de $\tau $ et son erreur. (Combinaison de deux mesures en tenant compte de leurs
erreurs). -Quelle méthode utilisez-vous pour cela? -Calculez l’estimation de $\tau $ et de son
erreur.
(2) A partir des deux mesures indépendantes ($\tau _{1},\sigma _{1}$) et ($\tau _{2},\sigma _{2}$): définissez le nombre équivalent $\tilde {N}_{1}$ et $\tilde {N}_{2}$
de chacune des deux mesures; donnez les relations les définissant. On utilise la méthode
du maximum de vraisemblance pour calculer l’estimation de $\tau $ à partir de la définition des
nombres équivalents d’évènements des deux mesures. Qu’obtenez-vous pour l’estimation
de $\tau $ dans ce cas. (Faites apparaître $\tau _{1},\sigma _{1}$ et $\tau _{2},\sigma _{2}$) dans l’expression. Comparez-la à l’estimation
précédente calculée plus haut en (1).
Correction:
On choisit comme dans l’exercice précédent la méthode du maximum de vraisemblance
avec la pdf des 2 mesures:
Pour cela on dispose d’un générateur de nombres aléatoires uniformes entre
$[0,1]$. Comment va-t-on procéder? (faites le schéma de la région d’intégration dans le plan
$(x,y)$).
Correction:
Rappel de la méthode Monte-Carlo:
Nous disposons de l’expression de l’espérance mathématique d’une fonction $g$ de variable
aléatoire $X$, résultant du théorème de transfert, selon lequel
\begin{equation}
G = E(g(X))=\int_a^b g(x)f_X(x) \, \mbox{d}x
\end{equation}
où $f_{X}$ est une fonction de densité sur le support $[a,b]$. Il est fréquent de prendre une distribution
uniforme sur $[a,b]$:
L’idée est de produire un échantillon $(x_{1},x_{2},...,x_{N})$ de la loi $X$ (donc d’après la densité $f_{X}$) sur le
support $[a,b]$, et de calculer un nouvel estimateur dit de Monte-Carlo, à partir de cet
échantillon.
La loi des grands nombres suggère de construire cet estimateur à partir de la moyenne
empirique:
qui se trouve être, par ailleurs, un estimateur sans biais de l’espérance.
Ceci est l’estimateur de Monte-Carlo. Nous voyons bien qu’en remplaçant l’échantillon
par un ensemble de valeurs prises dans le support d’une intégrale, et de la fonction à
intégrer, nous pouvons donc construire une approximation de sa valeur, construite
statistiquement.
La méthode Monte-Carlo permet grâce au générateur "uniforme" d’obtenir la valeur
numérique de l’intégrale ci-dessus notée $I$. La région d’intégration est représentée sur la
figure 1 ci-dessous:
Représentation de la région d’intégration
Nous pouvons envisager 2 cas:
cas (1) - On fait 2 tirages, un pour $x$ et un autre pour $y$:
Si $x_{i}>y_{i}$, alors on incrémente $I$ de la manière suivante: $I=I+f(x_{i},y_{i})$, sinon on réitère le tirage. On voit ici
que l’on fait 2 tirages et qu’en moyenne, 1 sur 2 est perdu.
Ensuite, selon les résultats, on incrémente $I$ de la manière suivante:
\begin{equation}
\textrm{Incrementation}\left\{
\begin{array}{lcc}
si &x_{i} > y_{i} & I=I+f(x_{i},y_{i}) \\
si &x_{i} < y_{i} & I=I+f(y_{i},x_{i}) \\
\end{array}
\right.
\end{equation}
L’avantage dans ce cas est que l’on utilise tous les tirages contrairement au cas
(1). Il faut ensuite multiplier la quantité $I$ obtenue par l’intervalle $(b-a)$ et la diviser par le
nombre de tirages effectués $N$. Nous avons ainsi calculé la valeur demandée de
l’intégrale.
Exercice 4.2:
Une source ponctuelle émet de manière isotrope et un détecteur "disque" perpendiculaire
à un axe passant par la source couvre un angle $\theta _{0}$. On a donc une symétrie cylindrique avec
2 angles: $\varphi $ entre [0,2$\pi $] et $\theta $ tel que $\text {cos}(\theta _{0})<\text {cos}(\theta )<1$.
Exprimez la pdf de $(\varphi ,\text {cos}\,\theta )$.
Disposant d’un générateur de nombres aléatoires uniformes entre [0,1], comment
allez-vous tirer de manière aléatoire dans l’acceptance du disque un couple $(\varphi ,\text {cos}\,\theta )$? A l’aide de ce détecteur on va faire des comptages pendant des intervalles de temps égaux
$\Delta t$. Quelle va être la loi de distribution des nombres de coups enregistrés?
Correction:
Puisque la source émet de façon isotrope, les variables aléatoires $\varphi $ et $\text {cos}\,\theta $ admettent une loi
uniforme respectivement sur [0,2$\pi $] et [$\text {cos}\,\theta _{0},1$].
Le nombre de coups enregistrés dans le compteur pendant $\Delta t$ va suivre une loi de
Poisson.
Exercice 5.1:
On dispose de mesures $y_{i}\,\,i=1,...,n$ dépendant d’une coordonnée $x_{i}$ dont le modèle théorique est
linéaire $y=ax+b$. A l’aide de ces mesures, on cherche à déterminer les valeurs des paramètres $a$ et
$b$.
Les mesures $y_{i}$ ont une erreur $\sigma _{i}$ et dans un premier temps, les coordonnées $x_{i}$ sont considérées
sans erreur.
- Exprimer le $\chi ^{2}$ que vous allez utiliser. - Donner les 2 équations vous permettant de calculer les estimations de $a$ et $b$.
Correction:
Quand nous avons $n$ mesures indépendantes $y_{i}\,i=1,...,n$ ainsi que $n$ coordonnées $x_{i}$ dans un modèle
linéaire $y=ax+b$, avec une erreur $\sigma _{i}$ sur $y_{i}$ et sans erreur sur $x_{i}$, le $\chi ^{2}$ s’écrit:
Il faut alors minimiser le $\chi ^{2}$ pour calculer les valeurs $a$ et $b$, ce qui s’obtient avec les 2
équations linéaires suivantes à 2 inconnues $a$ et $b$:
Les coordonnées $x_{i}$ sont elles aussi connues avec une erreur $\delta _{i}$.
Exprimez le $\chi ^{2}$ qui doit être utilisé dans ce cas. Donnez les 2 équations vous permettant de calculer les estimations de $a$ et $b$. Que
constatez-vous par rapport à la situation précédente?
Correction:
La formule du $\chi ^{2}$ va être modifiée car il faut tenir compte de l’erreur $\delta _{i}$ sur les coordonnées $x_{i}$.
En effet, la variance de $(y_{i}-a\,x_{i}-b)$ n’est plus seulement égale à $V(y_{i})=\sigma _{i}^{2}$:
La minimisation du $\chi ^{2}$ s’obtient toujours par les 2 équations suivantes: \begin{equation}
\dfrac{\partial\chi^{2}}{\partial
a}=0\,\,\,\text{et}\,\,\,\dfrac{\partial\chi^{2}}{\partial b}=0
\end{equation}
Mais nous voyons que ces équations ne sont pas linéaires car la deuxième qui minimise le $\chi ^{2}$
par $b$ dépend d’une puissance de $a$. Nous n’avons pas de solution analytique dans ce cas
là.
Exercice 6.1:
La méthode du $\chi ^{2}$ vous a permis de déterminer les valeurs de 2 paramètres $a\pm \sigma _{a}$ et $b\pm \sigma _{b}$ et donc la
valeur de $\chi _{min}^{2}$.
On veut tracer dans le plan $a,b$ le contour correspondant à un niveau de confiance
donné.
Donnez la loi de probabilité que vous utilisez. Dans ce cas, en fixant le niveau de confiance $CL$, donnez l’expression de la variation du $\chi ^{2}$ par
rapport à $\chi _{min}^{2}$, c’est-à-dire le contour correspondant à une valeur du $\chi ^{2}$ telle que:
$\chi ^{2}(CL)=\chi _{min}^{2}+\Delta \chi ^{2}$
Qu’obtenez-vous pour $CL=0.68$?
Correction:
Le terme $\chi ^{2}(CL)$ ne fait intervenir que les dérivées secondes suivantes du $\chi ^{2}$ à l’ordre le plus
bas: