# A mano test sobre media con va normales #Se esta interesado en obtener una estimacion del peso, #de una especie de ave en una cierta poblacion que se ubica #en una zona seca. Se toman 27 muestras de forma aleatoria #de la misma especie y se determina el peso para cada una de #ellas. El peso medio reportado fue de 37.4 gramos con una #varianza de 25. #Supongase que los datos asumen una distribucion #aproximadamente normal. #Es posible concluir que el peso medio de las aves de esa #poblacion sea igual a 40 gramos.? xbar=37.4 n = 27 mu = 40 var = 25 z<-(xbar-mu)/(var/sqrt(n)) z pnorm(z) #Es posible que el peso medio de las aves sea menor de 39?: xbar=37.4 n<-27 mu<-39 var<-25 z<-(xbar-mu)/(var/sqrt(n)) z pnorm(z) #t-test #Se realiza un experimento donde se midio la produccion de #vainas de frijol por cada mata producida, en 12 unidades #experimentales sometidas bajo las mismas condiciones. #datos mf<- c(18,11,17,10,20,25,13,16,25,20,19,20) #Se prueba el supuesto de normalidad shapiro.test(mf) par(mfrow=c(1,2)) mean(mf) boxplot(mf,col="gray85", main="Standard\nBoxplot") points(mean(mf), pch=20, cex = 1.5) text(17.5, "Promedio", col="red", font=8 ) median(mf) text(19, "Mediana", font=8) quantile(mf) text(14, "Cuantil 1", font=8) text(20.4, "Cuantil 3", font=8) hist(mf) library(PASWR) EDA(mf) #Dar un intervalo de confianza al 95% para el #rendimiento promedio del numero de vainas #producidas por cada mata de frijol. t.test(mf) #Construya un intervalo de confianza al 99% de #confianza para el rendimiento promedio de la de vainas #producidas por cada mata de frijol. t.test(mf, conf.level=0.99) #Supongamos que deseamos verificar la siguiente hipotesis #estadistica: el numero de vainas producidas por mata de frijol, # es diferente de 23, al 99% de confianza. t.test(mf,mu=23, alternative="two.sided", conf.level = 0.99) #Supongamos que deseamos verificar la siguiente hipotesis: el numero #de vainas producidas por mata es mayor que 23, al 99% de confianza. t.test(mf, mu=23, alternative="greater", conf.level = 0.99) #Suponga que se desea conocer que: si, el numero de vainas producidas #por mata es menor de 6, al 95% de confianza. t.test(mf,mu=6, alternative="less", conf.level = 0.95) #Genere 100 numeros aleatorios con distribucion normal, con una media #de 15, cuya desviacion estandar sea de 4.65. #Calcule el intervalo al 95% de confianza de los 100 datos aleatorios con #distribucion normal. set.seed(12345) rnorm(100,mean=15, sd=4.65)->x t.test(x) par(mfrow=c(1,2)) boxplot(x,col="gray85", main="Standard\nBoxplot") hist(x, main="Histrograma\nDatos", col="gray85") ------------------------------------------------------------------------------------------------------------------------ #test de Wilcoxon #alternativa al test t cuando no se tiene normalidad #Se cuentan en una parcela experimental, la cantidad de maleza #producida por metro cuadrado en una plantacion de maiz. #Los datos son los siguientes. ma<-c(1,3,6,4,18,11,6,6,3,4,2,5,5,4) EDA(ma) shapiro.test(ma) wilcox.test(ma, mu=10, alternative = "g", exact = FALSE) #Se lleva a cabo una encuesta, donde se les solicita a pacientes de un #hospital, que califiquen la atencion que se les ha brindado en dicha #institucion. #Se clasifican las respuestas utilizando una escala de 1 a 10, donde 10 #denota la mejor calificacion. Los datos son los siguientes. #El administrador desea sabe si la respuesta de calificacion media obtenida #es mayor a 7. x<-c(3,6,2,8,8,6,5,8,4,8,3,4,2,6,4,8,4,7,4,5,9,2,3,2,4,2,7,6) EDA(x) shapiro.test(x) wilcox.test(x, alternative="greater", mu=7, conf.level = 0.95,exact = FALSE ) #Preocupado el administrador por los primeros resultados, ahora desea #conocer si el puntaje medio es menor a 7. wilcox.test(x, mu=7, alternative = "l", exact = FALSE ) -------------------------------------------------------------------------------------------------------------------------------------- #Test t pareado #Se desarrolla una investigacion para conocer el efecto placebo en pacientes #con cierto tipo de enfermedad. Se mide una cierta determinacion medica #en un tiempo uno (t1: sin tomar el placebo) y su respuesta en un tiempo #dos (t2: despues de haber tomado el placebo), para conocer si hubo un #efecto. Los pacientes desconocen que el medicamento es un simple placebo. #Los datos son los siguientes: t1<-c(23,34,26,36,17,37,24,26,19,24,29,29) t2<-c(25,37,27,33,22,36,30,30,25,29,32,34) cbind(t1,t2)->tp boxplot(tp,col=c("wheat3","skyblue4"),main="Boxplot\nEfecto Placebo") t.test(t1,t2,paired=T) -------------------------------------------------------------------------------------------------------------------------------- #Test pareado de Wilcoxon #Se evalua la reduccion del peso (Kg) en personas obesas luego de seguir un #regimen de dieta y ejercicios. Se les tomo el peso inicial (p1), y tres meses #despues el peso final (p2). Los datos son los siguientes: P1<-c(111,128,111,117,119,90,115,118,109,115,118,113,92,79,75,93,86,99,118) P2<-c(88,118,100,107,119,87,105,121,111,117,108,103,96,82,72,90,91,92,115) #Se desea conocer si el regimen medio de la dieta fue efectivo shapiro.test(P1) shapiro.test(P2) data.frame(P1,P2)->rd rd boxplot(rd,col="gray85", main="Boxplot\nRegimen de Dieta") wilcox.test(P1,P2, paired=T,conf.int = TRUE, exact = FALSE) #Comparacion de varianzas var.test(P1,P2) var.test(t1,t2) #test de Kolmogorov Smirnov shapiro.test(P1) mean<-mean(P1) sd<-sd(P1) ks.test(P1, "pnorm", mean=mean(P1), sd=sd(P1)) ks.test(P1,P2) plot(ecdf(P1),xlim=range(c(P1,P2)),main="Distribucion Empirica Acumulada\n(P1,P2)") plot(ecdf(P2), add=TRUE, lty="dashed", col="red") qqplot(P1,P2, main="Q-Q Plot de P1 y P2") ------------------------------------------------------------------------------------------------------------------------------------ #Test t muestras independientes #Se tiene dos grupos experimentales, donde se seleccionan al azar 25 #muestras de cada grupo. Se mide en cada grupo una variable aleatoria #x, y se obtiene que la media del primer grupo es de 25.6 con una desviacion #estandar de 4.4. El grupo dos presento una media de 22.5, con una #desviacion estandar de 2.98. #Se quiere determinar si existe diferencia en los grupos experimentales, #al 95% de confianza. set.seed(12345) rnorm(25,mean=25.6, sd=4.4)->g1 set.seed(12345) rnorm(25,mean=22.5, sd=2.98)->g2 shapiro.test(g1) shapiro.test(g2) par(mfrow=c(1,2)) qqnorm(g1); text(-1,23,"Grupo\ng1", col="red",font=8) qqline(g1) qqnorm(g2);text(-1,23,"Grupo\ng2", col="red",font=8) qqline(g2) var.test(g1,g2) t.test (g1,g2,var.equal = T) #Se compara la edad de estudiantes que cursan el ultimo ano de colegio. #El grupo 1, se trata de un colegio diurno y el grupo 2 de un colegio #nocturno. #Los datos son los siguientes. edad1<-c(21.2, 23.8, 21.6, 23.0, 22.4, 22.8, 24.4, 21.7, 24.2, 21.7, 24.8, 22.4, 23.6, 23.2, 23.5, 22.4, 23.4, 23.7, 23.6, 23.5, 24.0, 24.3, 24.7, 24.3) edad2<-c(24.1, 32.5, 34.8, 23.6, 24.3, 19.5, 26.1, 28.3, 19.8, 23.9, 19.0, 21.6, 29.0, 17.7, 29.0, 19.6, 26.5, 20.9, 19.9, 23.8, 19.1, 39.2, 29.2, 22.8) #Se desea conocer si las edades medias de los grupos son diferentes. shapiro.test(edad1) shapiro.test(edad2) var.test(edad1,edad2) t.test(edad1,edad2,var.equal=F) ---------------------------------------------------------------------------------------------------------------------------- #Se desarrolla un experimento donde se desea conocer si un tipo de #atrayente resulta ser mas efectivo para la atraccion de insectos, los datos #son medidos cada hora y se contabiliza la cantidad de insectos que visitan #los atrayentes. Se utiliza un atrayente natural, vrs uno artificial. an<-c(19,25,35,30,29,29,28,30,16,25,26,16,17,21,24,35) ar<-c(9,30,3,30,19,29,28,3,6,30,17,18,2,23,19,3) shapiro.test(an) shapiro.test(ar) cbind(an,ar)->df boxplot(df, col=c("plum3","honeydew2"),main="Boxplot\natrayentes") wilcox.test(an,ar, alternative = "g",correct=F) diff<-c(an-ar) diff #Prop test res <- prop.test(x = c(490, 400), n = c(500, 500)) res