#####PRACTICO


####EJERCICIO 1


###1.1

A=c(46,7)

B=c(70,21)

C=c(89,45)

tabla_ejercicio1=cbind(A,B,C)

tabla_ejercicio1

View(tabla_ejercicio1)

rownames(tabla_ejercicio1)=c("X", "Y")

tabla_ejercicio1

View(tabla_ejercicio1)

chicuadradoejercicio1=chisq.test(tabla_ejercicio1)

chisq.test(tabla_ejercicio1)

summary(chicuadradoejercicio1)

chicuadradoejercicio1


###Para ver los valores esperados

chicuadradoejercicio1$expected

chicuadradoejercicio1


grupos=c("A","B", "C","A","B", "C")

categorias=c("x","x","x", "y", "y", "y")

frecuencia=c(46,70,89,7,21,45)

tabla_ggplotejercicio1=cbind(grupos,categorias,frecuencia)

View(tabla_ggplotejercicio1)

tabla_ggplotejercicio1=as.data.frame(tabla_ggplotejercicio1)

names(tabla_ggplotejercicio1)

tabla_ggplotejercicio1

is.numeric(tabla_ggplotejercicio1$frecuencia)

tabla_ggplotejercicio1$frecuencia=as.numeric(tabla_ggplotejercicio1$frecuencia)

is.numeric(tabla_ggplotejercicio1$frecuencia)



ggplot(tabla_ggplotejercicio1, aes(x = grupos, y = frecuencia)) +

  geom_bar(

    aes(color = categorias, fill = categorias),

    stat = "identity", position = position_stack()

  ) +

  scale_color_manual(values = c("#0073C2FF", "#EFC000FF"))+

  scale_fill_manual(values = c("#0073C2FF", "#EFC000FF"))

##########################################################################


#########EJERCICIO 2


attach(tabla_de_datos_practico_2_5_1_)

table(tabla_de_datos_practico_2_5_1_)

library(dplyr)

View(tabla_de_datos_practico_2_5_1_)

tablaejercicio2=tabla_de_datos_practico_2_5_1_ %>% 

  select(`grupo experimental`, diabetes) %>% 

  table()

tablaejercicio2

fisher.test(x = tablaejercicio2, alternative = "two.sided")

View(tablaejercicio2)

library(vcd)

assocstats(x = tablaejercicio2)



#####################EJERCICIO 3 ###############

attach(tabla_de_datos_practico_2_EJERCICIO3)

tablaejercicio3=tabla_de_datos_practico_2_EJERCICIO3 %>% 

  select(`Curso de nivelación`, `Primera prueba`,`Segunda prueba`) %>% 

  table()

tablaejercicio3

View(tablaejercicio3)


aprueba1=c(3,0)

noaprueba1=c(5,2)


tabla_ejercicio3.1=cbind(aprueba1,noaprueba1)

rownames(tabla_ejercicio3.1)=c("aprueba2", "noaprueba2")

tabla_ejercicio3.1


mcnemar.test(tabla_ejercicio3.1)


#####sankey########################

#Seleccionar variables y cambiar nombres en una columna


tabla_de_datos_practico_2EJERCICIO3$`Primera prueba`[`Primera prueba`=="Suficiente"]="Suficiente1"


tabla_de_datos_practico_2EJERCICIO3$`Primera prueba`[`Primera prueba`=="Insuficiente"]="Insuficiente1"

attach(tabla_de_datos_practico_2EJERCICIO3)

View(tabla_de_datos_practico_2EJERCICIO3)

library(highcharter)

library(htmlwidgets)

library(dplyr)


hchart(data_to_sankey(tabla_de_datos_practico_2EJERCICIO3), "sankey", name = "curso nivelación y pruebas")

dataForSankey <- tabla_de_datos_practico_2EJERCICIO3%>%dplyr::select(`Primera prueba`, `Curso de nivelación`, `Segunda prueba`)

hchart(data_to_sankey(dataForSankey), "sankey", name = "primera y segunda prueba")







######SCRIPT PARA MAHIRA

library(highcharter)

library(htmlwidgets)

library(dplyr)

attach((base_pronta_para_modelo))


names(base_pronta_para_modelo)


###Armamos una tbla que contiene solo las variables a plotear


tablaMahiraSankey=cbind(base_pronta_para_modelo$genprimeringreso,base_pronta_para_modelo$xnota1_intervalos,base_pronta_para_modelo$tipotray)


colnames(tablaMahiraSankey)=c("generacion_primer_ingr","promedio_notas_primer_semestre", "tipo_de_tray")

tablaMahiraSankey=as.data.frame(tablaMahiraSankey)

View(tablaMahiraSankey)


attach(tablaMahiraSankey)

tablaMahiraSankey$generacion_primer_ingr[generacion_primer_ingr]

tablaMahiraSankey$generacion_primer_ingr[generacion_primer_ingr=="1"]="Primer_ingreso"

tablaMahiraSankey$generacion_primer_ingr[generacion_primer_ingr=="0"]="NO_Primer_ingreso"

tablaMahiraSankey$tipo_de_tray[tipo_de_tray=="1"]="Normativa"

tablaMahiraSankey$tipo_de_tray[tipo_de_tray=="2"]="Alternante"

tablaMahiraSankey$tipo_de_tray[tipo_de_tray=="3"]="Desalentados"

tablaMahiraSankey$tipo_de_tray[tipo_de_tray=="4"]="Inactivos"

tablaMahiraSankey$promedio_notas_primer_semestre=as.numeric(tablaMahiraSankey$promedio_notas_primer_semestre)

attach(tablaMahiraSankey)

tablaMahiraSankey$promedio_notas_primer_semestre[is.na(promedio_notas_primer_semestre)]="Sinnota"


tablaMahiraSankey$promedio_notas_primer_semestre=as.factor(tablaMahiraSankey$promedio_notas_primer_semestre)

attach(tablaMahiraSankey)

###este comando es para ver cuantos NA  hay en la tabla

sum(is.na(tablaMahiraSankey$promedio_notas_primer_semestre))


####este es para exculir los na de la tabla

tablaMahiraSankey_SINna=na.exclude(tablaMahiraSankey)

View(tablaMahiraSankey_SINna)

sum(is.na(tablaMahiraSankey_SINna$promedio_notas_primer_semestre))

##para que lea bein el comando todas las faviables deben ser un facto

##por lo tanto las pasamos a todas como un factor

attach(tablaMahiraSankey)

tablaMahiraSankey$generacion_primer_ingr=as.factor(tablaMahiraSankey$generacion_primer_ingr)

tablaMahiraSankey$promedio_notas_primer_semestre=as.factor(tablaMahiraSankey$promedio_notas_primer_semestre)

tablaMahiraSankey$tipo_de_tray=as.factor(tablaMahiraSankey$tipo_de_tray)

attach(tablaMahiraSankey)


###ahora si hacemos el diagrama de Sankey

###para eso revisar el nombre de la tabla correcta y los nombres de las variables a graficar


dataForSankeyMahira <- tablaMahiraSankey_SINna%>%dplyr::select(generacion_primer_ingr, promedio_notas_primer_semestre, tipo_de_tray)

hchart(data_to_sankey(dataForSankeyMahira), "sankey", name = "mahirasankey")

View(dataForSankeyMahira)

#####PRACTICO


####EJERCICIO 1


###1.1

A=c(46,7)

B=c(70,21)

C=c(89,45)

tabla_ejercicio1=cbind(A,B,C)

tabla_ejercicio1

View(tabla_ejercicio1)

rownames(tabla_ejercicio1)=c("X", "Y")

tabla_ejercicio1

View(tabla_ejercicio1)

chicuadradoejercicio1=chisq.test(tabla_ejercicio1)

chisq.test(tabla_ejercicio1)

summary(chicuadradoejercicio1)

chicuadradoejercicio1


###Para ver los valores esperados

chicuadradoejercicio1$expected

chicuadradoejercicio1


grupos=c("A","B", "C","A","B", "C")

categorias=c("x","x","x", "y", "y", "y")

frecuencia=c(46,70,89,7,21,45)

tabla_ggplotejercicio1=cbind(grupos,categorias,frecuencia)

View(tabla_ggplotejercicio1)

tabla_ggplotejercicio1=as.data.frame(tabla_ggplotejercicio1)

names(tabla_ggplotejercicio1)

tabla_ggplotejercicio1

is.numeric(tabla_ggplotejercicio1$frecuencia)

tabla_ggplotejercicio1$frecuencia=as.numeric(tabla_ggplotejercicio1$frecuencia)

is.numeric(tabla_ggplotejercicio1$frecuencia)



ggplot(tabla_ggplotejercicio1, aes(x = grupos, y = frecuencia)) +

  geom_bar(

    aes(color = categorias, fill = categorias),

    stat = "identity", position = position_stack()

  ) +

  scale_color_manual(values = c("#0073C2FF", "#EFC000FF"))+

  scale_fill_manual(values = c("#0073C2FF", "#EFC000FF"))

##########################################################################


#########EJERCICIO 2


attach(tabla_de_datos_practico_2_5_1_)

table(tabla_de_datos_practico_2_5_1_)

library(dplyr)

View(tabla_de_datos_practico_2_5_1_)

tablaejercicio2=tabla_de_datos_practico_2_5_1_ %>% 

  select(`grupo experimental`, diabetes) %>% 

  table()

tablaejercicio2

fisher.test(x = tablaejercicio2, alternative = "two.sided")

View(tablaejercicio2)

library(vcd)

assocstats(x = tablaejercicio2)



#####################EJERCICIO 3 ###############

attach(tabla_de_datos_practico_2_EJERCICIO3)

tablaejercicio3=tabla_de_datos_practico_2_EJERCICIO3 %>% 

  select(`Curso de nivelación`, `Primera prueba`,`Segunda prueba`) %>% 

  table()

tablaejercicio3

View(tablaejercicio3)


aprueba1=c(3,0)

noaprueba1=c(5,2)


tabla_ejercicio3.1=cbind(aprueba1,noaprueba1)

rownames(tabla_ejercicio3.1)=c("aprueba2", "noaprueba2")

tabla_ejercicio3.1


mcnemar.test(tabla_ejercicio3.1)


#####sankey########################

#Seleccionar variables y cambiar nombres en una columna


tabla_de_datos_practico_2EJERCICIO3$`Primera prueba`[`Primera prueba`=="Suficiente"]="Suficiente1"


tabla_de_datos_practico_2EJERCICIO3$`Primera prueba`[`Primera prueba`=="Insuficiente"]="Insuficiente1"

attach(tabla_de_datos_practico_2EJERCICIO3)

View(tabla_de_datos_practico_2EJERCICIO3)

library(highcharter)

library(htmlwidgets)

library(dplyr)


hchart(data_to_sankey(tabla_de_datos_practico_2EJERCICIO3), "sankey", name = "curso nivelación y pruebas")

dataForSankey <- tabla_de_datos_practico_2EJERCICIO3%>%dplyr::select(`Primera prueba`, `Curso de nivelación`, `Segunda prueba`)

hchart(data_to_sankey(dataForSankey), "sankey", name = "primera y segunda prueba")







######SCRIPT PARA MAHIRA

library(highcharter)

library(htmlwidgets)

library(dplyr)

attach((base_pronta_para_modelo))


names(base_pronta_para_modelo)


###Armamos una tbla que contiene solo las variables a plotear


tablaMahiraSankey=cbind(base_pronta_para_modelo$genprimeringreso,base_pronta_para_modelo$xnota1_intervalos,base_pronta_para_modelo$tipotray)


colnames(tablaMahiraSankey)=c("generacion_primer_ingr","promedio_notas_primer_semestre", "tipo_de_tray")

tablaMahiraSankey=as.data.frame(tablaMahiraSankey)

View(tablaMahiraSankey)


attach(tablaMahiraSankey)

tablaMahiraSankey$generacion_primer_ingr[generacion_primer_ingr]

tablaMahiraSankey$generacion_primer_ingr[generacion_primer_ingr=="1"]="Primer_ingreso"

tablaMahiraSankey$generacion_primer_ingr[generacion_primer_ingr=="0"]="NO_Primer_ingreso"

tablaMahiraSankey$tipo_de_tray[tipo_de_tray=="1"]="Normativa"

tablaMahiraSankey$tipo_de_tray[tipo_de_tray=="2"]="Alternante"

tablaMahiraSankey$tipo_de_tray[tipo_de_tray=="3"]="Desalentados"

tablaMahiraSankey$tipo_de_tray[tipo_de_tray=="4"]="Inactivos"

tablaMahiraSankey$promedio_notas_primer_semestre=as.numeric(tablaMahiraSankey$promedio_notas_primer_semestre)

attach(tablaMahiraSankey)

tablaMahiraSankey$promedio_notas_primer_semestre[is.na(promedio_notas_primer_semestre)]="Sinnota"


tablaMahiraSankey$promedio_notas_primer_semestre=as.factor(tablaMahiraSankey$promedio_notas_primer_semestre)

attach(tablaMahiraSankey)

###este comando es para ver cuantos NA  hay en la tabla

sum(is.na(tablaMahiraSankey$promedio_notas_primer_semestre))


####este es para exculir los na de la tabla

tablaMahiraSankey_SINna=na.exclude(tablaMahiraSankey)

View(tablaMahiraSankey_SINna)

sum(is.na(tablaMahiraSankey_SINna$promedio_notas_primer_semestre))

##para que lea bein el comando todas las faviables deben ser un facto

##por lo tanto las pasamos a todas como un factor

attach(tablaMahiraSankey)

tablaMahiraSankey$generacion_primer_ingr=as.factor(tablaMahiraSankey$generacion_primer_ingr)

tablaMahiraSankey$promedio_notas_primer_semestre=as.factor(tablaMahiraSankey$promedio_notas_primer_semestre)

tablaMahiraSankey$tipo_de_tray=as.factor(tablaMahiraSankey$tipo_de_tray)

attach(tablaMahiraSankey)


###ahora si hacemos el diagrama de Sankey

###para eso revisar el nombre de la tabla correcta y los nombres de las variables a graficar


dataForSankeyMahira <- tablaMahiraSankey_SINna%>%dplyr::select(generacion_primer_ingr, promedio_notas_primer_semestre, tipo_de_tray)

hchart(data_to_sankey(dataForSankeyMahira), "sankey", name = "mahirasankey")

View(dataForSankeyMahira)


Última atualização: sexta-feira, 9 mai. 2025, 15:14