#####PRACTICO
####EJERCICIO 1
###1.1
A=c(46,7)
B=c(70,21)
C=c(89,45)
tabla_ejercicio1=cbind(A,B,C)
tabla_ejercicio1
View(tabla_ejercicio1)
rownames(tabla_ejercicio1)=c("X", "Y")
tabla_ejercicio1
View(tabla_ejercicio1)
chicuadradoejercicio1=chisq.test(tabla_ejercicio1)
chisq.test(tabla_ejercicio1)
summary(chicuadradoejercicio1)
chicuadradoejercicio1
###Para ver los valores esperados
chicuadradoejercicio1$expected
chicuadradoejercicio1
grupos=c("A","B", "C","A","B", "C")
categorias=c("x","x","x", "y", "y", "y")
frecuencia=c(46,70,89,7,21,45)
tabla_ggplotejercicio1=cbind(grupos,categorias,frecuencia)
View(tabla_ggplotejercicio1)
tabla_ggplotejercicio1=as.data.frame(tabla_ggplotejercicio1)
names(tabla_ggplotejercicio1)
tabla_ggplotejercicio1
is.numeric(tabla_ggplotejercicio1$frecuencia)
tabla_ggplotejercicio1$frecuencia=as.numeric(tabla_ggplotejercicio1$frecuencia)
is.numeric(tabla_ggplotejercicio1$frecuencia)
ggplot(tabla_ggplotejercicio1, aes(x = grupos, y = frecuencia)) +
geom_bar(
aes(color = categorias, fill = categorias),
stat = "identity", position = position_stack()
) +
scale_color_manual(values = c("#0073C2FF", "#EFC000FF"))+
scale_fill_manual(values = c("#0073C2FF", "#EFC000FF"))
##########################################################################
#########EJERCICIO 2
attach(tabla_de_datos_practico_2_5_1_)
table(tabla_de_datos_practico_2_5_1_)
library(dplyr)
View(tabla_de_datos_practico_2_5_1_)
tablaejercicio2=tabla_de_datos_practico_2_5_1_ %>%
select(`grupo experimental`, diabetes) %>%
table()
tablaejercicio2
fisher.test(x = tablaejercicio2, alternative = "two.sided")
View(tablaejercicio2)
library(vcd)
assocstats(x = tablaejercicio2)
#####################EJERCICIO 3 ###############
attach(tabla_de_datos_practico_2_EJERCICIO3)
tablaejercicio3=tabla_de_datos_practico_2_EJERCICIO3 %>%
select(`Curso de nivelación`, `Primera prueba`,`Segunda prueba`) %>%
table()
tablaejercicio3
View(tablaejercicio3)
aprueba1=c(3,0)
noaprueba1=c(5,2)
tabla_ejercicio3.1=cbind(aprueba1,noaprueba1)
rownames(tabla_ejercicio3.1)=c("aprueba2", "noaprueba2")
tabla_ejercicio3.1
mcnemar.test(tabla_ejercicio3.1)
#####sankey########################
#Seleccionar variables y cambiar nombres en una columna
tabla_de_datos_practico_2EJERCICIO3$`Primera prueba`[`Primera prueba`=="Suficiente"]="Suficiente1"
tabla_de_datos_practico_2EJERCICIO3$`Primera prueba`[`Primera prueba`=="Insuficiente"]="Insuficiente1"
attach(tabla_de_datos_practico_2EJERCICIO3)
View(tabla_de_datos_practico_2EJERCICIO3)
library(highcharter)
library(htmlwidgets)
library(dplyr)
hchart(data_to_sankey(tabla_de_datos_practico_2EJERCICIO3), "sankey", name = "curso nivelación y pruebas")
dataForSankey <- tabla_de_datos_practico_2EJERCICIO3%>%dplyr::select(`Primera prueba`, `Curso de nivelación`, `Segunda prueba`)
hchart(data_to_sankey(dataForSankey), "sankey", name = "primera y segunda prueba")
######SCRIPT PARA MAHIRA
library(highcharter)
library(htmlwidgets)
library(dplyr)
attach((base_pronta_para_modelo))
names(base_pronta_para_modelo)
###Armamos una tbla que contiene solo las variables a plotear
tablaMahiraSankey=cbind(base_pronta_para_modelo$genprimeringreso,base_pronta_para_modelo$xnota1_intervalos,base_pronta_para_modelo$tipotray)
colnames(tablaMahiraSankey)=c("generacion_primer_ingr","promedio_notas_primer_semestre", "tipo_de_tray")
tablaMahiraSankey=as.data.frame(tablaMahiraSankey)
View(tablaMahiraSankey)
attach(tablaMahiraSankey)
tablaMahiraSankey$generacion_primer_ingr[generacion_primer_ingr]
tablaMahiraSankey$generacion_primer_ingr[generacion_primer_ingr=="1"]="Primer_ingreso"
tablaMahiraSankey$generacion_primer_ingr[generacion_primer_ingr=="0"]="NO_Primer_ingreso"
tablaMahiraSankey$tipo_de_tray[tipo_de_tray=="1"]="Normativa"
tablaMahiraSankey$tipo_de_tray[tipo_de_tray=="2"]="Alternante"
tablaMahiraSankey$tipo_de_tray[tipo_de_tray=="3"]="Desalentados"
tablaMahiraSankey$tipo_de_tray[tipo_de_tray=="4"]="Inactivos"
tablaMahiraSankey$promedio_notas_primer_semestre=as.numeric(tablaMahiraSankey$promedio_notas_primer_semestre)
attach(tablaMahiraSankey)
tablaMahiraSankey$promedio_notas_primer_semestre[is.na(promedio_notas_primer_semestre)]="Sinnota"
tablaMahiraSankey$promedio_notas_primer_semestre=as.factor(tablaMahiraSankey$promedio_notas_primer_semestre)
attach(tablaMahiraSankey)
###este comando es para ver cuantos NA hay en la tabla
sum(is.na(tablaMahiraSankey$promedio_notas_primer_semestre))
####este es para exculir los na de la tabla
tablaMahiraSankey_SINna=na.exclude(tablaMahiraSankey)
View(tablaMahiraSankey_SINna)
sum(is.na(tablaMahiraSankey_SINna$promedio_notas_primer_semestre))
##para que lea bein el comando todas las faviables deben ser un facto
##por lo tanto las pasamos a todas como un factor
attach(tablaMahiraSankey)
tablaMahiraSankey$generacion_primer_ingr=as.factor(tablaMahiraSankey$generacion_primer_ingr)
tablaMahiraSankey$promedio_notas_primer_semestre=as.factor(tablaMahiraSankey$promedio_notas_primer_semestre)
tablaMahiraSankey$tipo_de_tray=as.factor(tablaMahiraSankey$tipo_de_tray)
attach(tablaMahiraSankey)
###ahora si hacemos el diagrama de Sankey
###para eso revisar el nombre de la tabla correcta y los nombres de las variables a graficar
dataForSankeyMahira <- tablaMahiraSankey_SINna%>%dplyr::select(generacion_primer_ingr, promedio_notas_primer_semestre, tipo_de_tray)
hchart(data_to_sankey(dataForSankeyMahira), "sankey", name = "mahirasankey")
View(dataForSankeyMahira)
#####PRACTICO
####EJERCICIO 1
###1.1
A=c(46,7)
B=c(70,21)
C=c(89,45)
tabla_ejercicio1=cbind(A,B,C)
tabla_ejercicio1
View(tabla_ejercicio1)
rownames(tabla_ejercicio1)=c("X", "Y")
tabla_ejercicio1
View(tabla_ejercicio1)
chicuadradoejercicio1=chisq.test(tabla_ejercicio1)
chisq.test(tabla_ejercicio1)
summary(chicuadradoejercicio1)
chicuadradoejercicio1
###Para ver los valores esperados
chicuadradoejercicio1$expected
chicuadradoejercicio1
grupos=c("A","B", "C","A","B", "C")
categorias=c("x","x","x", "y", "y", "y")
frecuencia=c(46,70,89,7,21,45)
tabla_ggplotejercicio1=cbind(grupos,categorias,frecuencia)
View(tabla_ggplotejercicio1)
tabla_ggplotejercicio1=as.data.frame(tabla_ggplotejercicio1)
names(tabla_ggplotejercicio1)
tabla_ggplotejercicio1
is.numeric(tabla_ggplotejercicio1$frecuencia)
tabla_ggplotejercicio1$frecuencia=as.numeric(tabla_ggplotejercicio1$frecuencia)
is.numeric(tabla_ggplotejercicio1$frecuencia)
ggplot(tabla_ggplotejercicio1, aes(x = grupos, y = frecuencia)) +
geom_bar(
aes(color = categorias, fill = categorias),
stat = "identity", position = position_stack()
) +
scale_color_manual(values = c("#0073C2FF", "#EFC000FF"))+
scale_fill_manual(values = c("#0073C2FF", "#EFC000FF"))
##########################################################################
#########EJERCICIO 2
attach(tabla_de_datos_practico_2_5_1_)
table(tabla_de_datos_practico_2_5_1_)
library(dplyr)
View(tabla_de_datos_practico_2_5_1_)
tablaejercicio2=tabla_de_datos_practico_2_5_1_ %>%
select(`grupo experimental`, diabetes) %>%
table()
tablaejercicio2
fisher.test(x = tablaejercicio2, alternative = "two.sided")
View(tablaejercicio2)
library(vcd)
assocstats(x = tablaejercicio2)
#####################EJERCICIO 3 ###############
attach(tabla_de_datos_practico_2_EJERCICIO3)
tablaejercicio3=tabla_de_datos_practico_2_EJERCICIO3 %>%
select(`Curso de nivelación`, `Primera prueba`,`Segunda prueba`) %>%
table()
tablaejercicio3
View(tablaejercicio3)
aprueba1=c(3,0)
noaprueba1=c(5,2)
tabla_ejercicio3.1=cbind(aprueba1,noaprueba1)
rownames(tabla_ejercicio3.1)=c("aprueba2", "noaprueba2")
tabla_ejercicio3.1
mcnemar.test(tabla_ejercicio3.1)
#####sankey########################
#Seleccionar variables y cambiar nombres en una columna
tabla_de_datos_practico_2EJERCICIO3$`Primera prueba`[`Primera prueba`=="Suficiente"]="Suficiente1"
tabla_de_datos_practico_2EJERCICIO3$`Primera prueba`[`Primera prueba`=="Insuficiente"]="Insuficiente1"
attach(tabla_de_datos_practico_2EJERCICIO3)
View(tabla_de_datos_practico_2EJERCICIO3)
library(highcharter)
library(htmlwidgets)
library(dplyr)
hchart(data_to_sankey(tabla_de_datos_practico_2EJERCICIO3), "sankey", name = "curso nivelación y pruebas")
dataForSankey <- tabla_de_datos_practico_2EJERCICIO3%>%dplyr::select(`Primera prueba`, `Curso de nivelación`, `Segunda prueba`)
hchart(data_to_sankey(dataForSankey), "sankey", name = "primera y segunda prueba")
######SCRIPT PARA MAHIRA
library(highcharter)
library(htmlwidgets)
library(dplyr)
attach((base_pronta_para_modelo))
names(base_pronta_para_modelo)
###Armamos una tbla que contiene solo las variables a plotear
tablaMahiraSankey=cbind(base_pronta_para_modelo$genprimeringreso,base_pronta_para_modelo$xnota1_intervalos,base_pronta_para_modelo$tipotray)
colnames(tablaMahiraSankey)=c("generacion_primer_ingr","promedio_notas_primer_semestre", "tipo_de_tray")
tablaMahiraSankey=as.data.frame(tablaMahiraSankey)
View(tablaMahiraSankey)
attach(tablaMahiraSankey)
tablaMahiraSankey$generacion_primer_ingr[generacion_primer_ingr]
tablaMahiraSankey$generacion_primer_ingr[generacion_primer_ingr=="1"]="Primer_ingreso"
tablaMahiraSankey$generacion_primer_ingr[generacion_primer_ingr=="0"]="NO_Primer_ingreso"
tablaMahiraSankey$tipo_de_tray[tipo_de_tray=="1"]="Normativa"
tablaMahiraSankey$tipo_de_tray[tipo_de_tray=="2"]="Alternante"
tablaMahiraSankey$tipo_de_tray[tipo_de_tray=="3"]="Desalentados"
tablaMahiraSankey$tipo_de_tray[tipo_de_tray=="4"]="Inactivos"
tablaMahiraSankey$promedio_notas_primer_semestre=as.numeric(tablaMahiraSankey$promedio_notas_primer_semestre)
attach(tablaMahiraSankey)
tablaMahiraSankey$promedio_notas_primer_semestre[is.na(promedio_notas_primer_semestre)]="Sinnota"
tablaMahiraSankey$promedio_notas_primer_semestre=as.factor(tablaMahiraSankey$promedio_notas_primer_semestre)
attach(tablaMahiraSankey)
###este comando es para ver cuantos NA hay en la tabla
sum(is.na(tablaMahiraSankey$promedio_notas_primer_semestre))
####este es para exculir los na de la tabla
tablaMahiraSankey_SINna=na.exclude(tablaMahiraSankey)
View(tablaMahiraSankey_SINna)
sum(is.na(tablaMahiraSankey_SINna$promedio_notas_primer_semestre))
##para que lea bein el comando todas las faviables deben ser un facto
##por lo tanto las pasamos a todas como un factor
attach(tablaMahiraSankey)
tablaMahiraSankey$generacion_primer_ingr=as.factor(tablaMahiraSankey$generacion_primer_ingr)
tablaMahiraSankey$promedio_notas_primer_semestre=as.factor(tablaMahiraSankey$promedio_notas_primer_semestre)
tablaMahiraSankey$tipo_de_tray=as.factor(tablaMahiraSankey$tipo_de_tray)
attach(tablaMahiraSankey)
###ahora si hacemos el diagrama de Sankey
###para eso revisar el nombre de la tabla correcta y los nombres de las variables a graficar
dataForSankeyMahira <- tablaMahiraSankey_SINna%>%dplyr::select(generacion_primer_ingr, promedio_notas_primer_semestre, tipo_de_tray)
hchart(data_to_sankey(dataForSankeyMahira), "sankey", name = "mahirasankey")
View(dataForSankeyMahira)