Ejercicio 1, Práctico 4

Parte a

Se da \(X_1, \ldots, X_n\) una poblacion con distribución uniforme en el intervalo \([0, \theta]\), con \(\theta\) desconocido que se desea estimar.

Sea \(Y = \max_i X_i\). Nótese que necesariamente tenemos \(\theta > Y\).

En un primer caso consideramos el intervalo \([aY, bY]\), \(1 \leq a < b\). Calculemos la probabilidad de que el parámetro pertenezca a este intervalo.

\[ P_\theta(\theta \in [aY, bY]) = P_\theta(aY \leq \theta \leq bY) \\ = P_\theta \left( \frac{1}{b} \leq \frac{Y}{\theta} \leq \frac{1}{a} \right) \\ = P_\theta \left( \frac{1}{b} \leq T \leq \frac{1}{a} \right). \] con \(T = Y/\theta\).

A continuación probamos que la distribución de \(T\) es \(f_T(t) = nt^{n-1}\), \(0 \leq t \leq 1\).

Utilizando la pdf de \(T\), tenemos que

\[ P_\theta(\theta \in [aY, bY]) = \int_{1/b}^{1/a} nt^{n-1}dt = \left( \frac{1}{a}\right)^n - \left( \frac{1}{b} \right)^n. \] En este caso, la probabilidad de cobertura es independiente del valor de \(\theta\). El coeficiente de confianza para el intervalo aleatorio \(C(X) = [aY, bY]\) es \(\left( \frac{1}{a}\right)^n - \left( \frac{1}{b} \right)^n\).

Por ejemplo consideremos el caso \(a=1\), \(b = 2\). El coeficiente de confianza es \(f = 1 - 2^{-n}\).

theta = 4.60
n = 6
x = runif(n, 0, theta)
plot(hist(x))  # grafico el histograma
Y = max(x)
# Estimacion de theta con el intervalo aleatorio [aY, bY]
# --------------------------------------------------------

a = 1  # elejimos valores para a y b
b = 2  # notese que el coeficiente de confianza aumenta exponenialmente con n para un b fijo
f = (1/a)^n - (1/b)^n   # coeficiente de confianza

# construccion del intervalo
L = a * Y
U = b * Y
# verifico la hipotesis
L < theta && theta < U
# Ahora lo hacemos en un loop para verificar el intervalo de confianza
# ----------------------------------------------------------------------

realizaciones = 5000
v = vector("logical", realizaciones)
for(i in 1:realizaciones){
  x = runif(n, 0, theta)
  Y = max(x)
  L = a * Y
  U = b * Y
  # verifico la hipotesis
  v[i] = L < theta && theta < U
}

# cuento el numero de veces que obtuve TRUE
fraccion_aciertos = sum(v == TRUE) / length(v)

Parte b

En un segundo caso consideramos el intervalo \([Y+c, Y+d]\), \(0 \leq c < d\).

\[ P_\theta(\theta \in [Y+c, Y+d]) = P_\theta(Y+c \leq \theta \leq Y+d) \\ = P_\theta \left( 1 - \frac{d}{\theta} \leq T \leq 1 - \frac{c}{\theta} \right) \] con \(T = Y/\theta\). Suponemos wlog \(\theta \geq d\), \[ P_\theta(\theta \in [Y+c, Y+d]) = \int_{1-d/\theta}^{1-c/\theta} nt^{n-1} dt = \left( 1 - \frac{c}{\theta}\right)^n - \left( 1 - \frac{d}{\theta}\right)^n. \] En este caso la probabilidad de cobertura depende fuertemente del valor de \(\theta\). De hecho, el coeficiente de confianza es el ínfimo sobre todos los posibles valores de \(\theta\), por tanto \[ \inf_{\theta \geq 0} P_\theta(\theta \in [Y+c, Y+d]) = \inf_{\theta \geq 0} \left[ \left( 1 - \frac{c}{\theta}\right)^n - \left( 1 - \frac{d}{\theta}\right)^n \right] = 0. \] No se puede garantizar un valor no nulo de confianza para el estimador por intervalo en este caso.