Se da \(X_1, \ldots, X_n\) una poblacion con distribución uniforme en el intervalo \([0, \theta]\), con \(\theta\) desconocido que se desea estimar.
Sea \(Y = \max_i X_i\). Nótese que necesariamente tenemos \(\theta > Y\).
En un primer caso consideramos el intervalo \([aY, bY]\), \(1 \leq a < b\). Calculemos la probabilidad de que el parámetro pertenezca a este intervalo.
\[ P_\theta(\theta \in [aY, bY]) = P_\theta(aY \leq \theta \leq bY) \\ = P_\theta \left( \frac{1}{b} \leq \frac{Y}{\theta} \leq \frac{1}{a} \right) \\ = P_\theta \left( \frac{1}{b} \leq T \leq \frac{1}{a} \right). \] con \(T = Y/\theta\).
A continuación probamos que la distribución de \(T\) es \(f_T(t) = nt^{n-1}\), \(0 \leq t \leq 1\).
Utilizando la pdf de \(T\), tenemos que
\[ P_\theta(\theta \in [aY, bY]) = \int_{1/b}^{1/a} nt^{n-1}dt = \left( \frac{1}{a}\right)^n - \left( \frac{1}{b} \right)^n. \] En este caso, la probabilidad de cobertura es independiente del valor de \(\theta\). El coeficiente de confianza para el intervalo aleatorio \(C(X) = [aY, bY]\) es \(\left( \frac{1}{a}\right)^n - \left( \frac{1}{b} \right)^n\).
Por ejemplo consideremos el caso \(a=1\), \(b = 2\). El coeficiente de confianza es \(f = 1 - 2^{-n}\).
theta = 4.60
n = 6
x = runif(n, 0, theta)
plot(hist(x)) # grafico el histograma
Y = max(x)
# Estimacion de theta con el intervalo aleatorio [aY, bY]
# --------------------------------------------------------
a = 1 # elejimos valores para a y b
b = 2 # notese que el coeficiente de confianza aumenta exponenialmente con n para un b fijo
f = (1/a)^n - (1/b)^n # coeficiente de confianza
# construccion del intervalo
L = a * Y
U = b * Y
# verifico la hipotesis
L < theta && theta < U
# Ahora lo hacemos en un loop para verificar el intervalo de confianza
# ----------------------------------------------------------------------
realizaciones = 5000
v = vector("logical", realizaciones)
for(i in 1:realizaciones){
x = runif(n, 0, theta)
Y = max(x)
L = a * Y
U = b * Y
# verifico la hipotesis
v[i] = L < theta && theta < U
}
# cuento el numero de veces que obtuve TRUE
fraccion_aciertos = sum(v == TRUE) / length(v)
En un segundo caso consideramos el intervalo \([Y+c, Y+d]\), \(0 \leq c < d\).
\[ P_\theta(\theta \in [Y+c, Y+d]) = P_\theta(Y+c \leq \theta \leq Y+d) \\ = P_\theta \left( 1 - \frac{d}{\theta} \leq T \leq 1 - \frac{c}{\theta} \right) \] con \(T = Y/\theta\). Suponemos wlog \(\theta \geq d\), \[ P_\theta(\theta \in [Y+c, Y+d]) = \int_{1-d/\theta}^{1-c/\theta} nt^{n-1} dt = \left( 1 - \frac{c}{\theta}\right)^n - \left( 1 - \frac{d}{\theta}\right)^n. \] En este caso la probabilidad de cobertura depende fuertemente del valor de \(\theta\). De hecho, el coeficiente de confianza es el ínfimo sobre todos los posibles valores de \(\theta\), por tanto \[ \inf_{\theta \geq 0} P_\theta(\theta \in [Y+c, Y+d]) = \inf_{\theta \geq 0} \left[ \left( 1 - \frac{c}{\theta}\right)^n - \left( 1 - \frac{d}{\theta}\right)^n \right] = 0. \] No se puede garantizar un valor no nulo de confianza para el estimador por intervalo en este caso.