Recurde que LRT = Likelihood Ratio Test, es el test que involucra el cálculo de la función \(λ(x)\) (aqui \(x\) podria ser un vector de parametros),
\[ \lambda(x) = \dfrac{\sup_{\theta \in \Theta_0} L(\theta \vert x)}{\sup_{\theta \in \Theta} L(\theta \vert x)} \] donde \(L(\theta \vert x)\) es la funcion de maxima verosimilitud; el denominador de \(λ(x)\) es el MLE (optimizacion sin restricciones).
El estadistico LRT para el test \(H_0 : \theta \in \Theta_0\) vs. \(H_1 : \theta \in \Theta_0^C\): es un test cuya region de rechazo es: \[ R = \{ x : \lambda(x) \leq c \}, \] con \(c\) en el intervalo \([0, 1]\).
Recordemos que la función de potencia asociada a un test de hipótesis con region de rechazo R es la función del parámetro θ:
\[ β(θ) = P_θ (X ∈ R) = \begin{cases} \textrm{prob. error tipo I si } ϴ ∈ Θ_0 \\ 1-\textrm{prob. error tipo II si } ϴ ∈ Θ_0^C \\ \end{cases} \]
Queremos que para todos los \(θ ∈ Θ_0\) (region del espacio de parámetros asociado a la hipótesis nula), la probabilidad de errar es decir de rechazar \(H_0\) sea pequeña, ie. \(β(\theta)\) pequeño (idealmente 0) cuando \(θ ∈ Θ_0\). Ésta es la probabilidad de error tipo I.
Asimismo, para \(θ ∈ Θ_0^C\) quiero que \(P_θ (X ∈ R)\) sea grande (idealmente 1), que significa que el error tipo II es pequeño (recordar que el error tipo II corresponde a aceptar la hipótesis nula cuando en realidad deberia rechazarla). Ver la tabla que se presentar a continuación.
Acepto \(H_0\) | Rechazo \(H_0\) | |
---|---|---|
\(H_0\) verdadero | Correcto | Error Tipo I |
\(H_1\) verdadero | Error Tipo II | Correcto |
Para analizar el error Tipo I se suele definir el concepto de tamaño y nivel de un test de hipótesis.
Def. (tamaño de un test). Para \(0 ≤ α ≤ 1\), un test con función de potencia \(β(θ)\) es un test de tamaño \(α\) si \(\sup_{θ ∈ Θ_0} β(θ) = α\).
Def. (nivel de un test). Para \(0 ≤ α ≤ 1\), un test con función de potencia \(β(θ)\) es un test de nivel \(α\) si \(\sup_{θ ∈ Θ_0} β(θ) ≤ α\).
Para un LRT dado, rechazamos \(H_0\) si \(\lambda(X) ≤ c\), pero \(c\) no se especifica, es decir se define toda una familia de tests de hipotesis (para cada valor de \(c\)). La restriccion a un test de tamano \(α\) me permite seleccionar un test dentro de esta familia.
Recurede que un test de hipótesis de nivel \(α\) tiene una probabilidad de error tipo I de a lo sumo \(α\) para todo \(θ ∈ Θ_0\). Idealmente, un buen test también tendría una probabilidad de error tipo 2 pequeña, es decir \(β(θ)\) grande para \(θ ∈ Θ_0^C\).
Def. (UMP, uniformly most powerful) Sea \(C\) una clase de tests \(H_0 : θ ∈ Θ_0\) vs. \(H_1 : \theta \in Θ_0^C\). Un test en la clase \(C\) con función de potencia \(β(\theta)\) se dice UMP si \(β(θ) ≥ β'(θ)\) para todo \(θ \in Θ_0^C\) y todo \(β'(θ)\) que es una funcioon de potencia de un test en la clase \(C\).
Sea \(X_1, …, X_n\) una muestra aleatoria iid de una poblacion normal, \(X_i ∼ \mathcal{N}(θ, σ^2)\). Consideramos el test de hipotesis \[ H_0: θ ≤ θ_0 \text{ vs. } H_1: θ > θ_0. \]
En este ejercicio consideraremos un LRT de tamano \(α\). Tambien demostraremos que dicho test es un test UMP.
La funcion de verosimilitud es normal en \(\theta\),
\[ L(θ|x) = (2πσ^2)^{-n/2} \prod_{i=1}^n e^{-(x_i-θ)^2/2\sigma^2}. \]
El estadistico LRT es
\[ \lambda(x) = \begin{cases} e^{-n(\bar{x} - \theta_0)^2/2\sigma^2},\qquad \bar{x} \ge \theta_0, \\ 1,\qquad \bar{x} < \theta_0. \end{cases} \]
Por lo tanto, rechazar \(λ < c\) es equivalente a rechazar si \[ (\bar{x} - \theta_0)/(\sigma/\sqrt{n}) > c' \]
Es UMP por Karlin-Rubin.
Ver notas.