### Librerís WordCloud ```{r} library(NLP) library(tm) library(wordcloud) library(RColorBrewer) Texto_Fenix <- data.frame("Soy hincha de Fenix, y es un sufrimiento. Voy a la cancha y me las quiero cortar. Pero amo a Fenix, salimos campeones de la liguilla, una copa que no existe más!!! Fenix, Fenix") Texto <- DataframeSource(Texto_Fenix) Texto corp <- Corpus(Texto) corp <- tm_map(corp,removePunctuation) corp <- tm_map(corp,tolower) corp <- tm_map(corp,removeNumbers) corp <- tm_map(corp, removeWords, stopwords("spanish")) corp <- tm_map(corp, PlainTextDocument) matriz.terminos <- TermDocumentMatrix(corp) matriz.terminos <- as.matrix(matriz.terminos) matriz.terminos vector.terminos <- sort(rowSums(matriz.terminos),decreasing=TRUE) vector.terminos dataframe.terminos <- data.frame(word = names(vector.terminos),freq=vector.terminos) dataframe.terminos wordcloud(dataframe.terminos$word,dataframe.terminos$freq, scale=c(4,.2),min.freq=1, max.words=Inf, random.order=FALSE, rot.per=.15, colors=brewer.pal(8,"Dark2")) ``` ###Ejemplo real con estudio de ANTEL ```{r} setwd("C:/Users/Acer/Desktop/EP_R") Antel <- suppressWarnings(paste(readLines("Necesidades Antel.txt"), collapse=" ")) tmpText <- data.frame(c(Antel)) ds <- DataframeSource(tmpText) corp <- Corpus(ds) corp <- tm_map(corp,removePunctuation) corp <- tm_map(corp,tolower) corp <- tm_map(corp,removeNumbers) corp <- tm_map(corp, removeWords, stopwords("spanish")) corp <- tm_map(corp, PlainTextDocument) term.matrix <- TermDocumentMatrix(corp) term.matrix <- as.matrix(term.matrix) term.v <- sort(rowSums(term.matrix),decreasing=TRUE) term.d <- data.frame(word = names(term.v),freq=term.v) wordcloud(term.d$word,term.d$freq, scale=c(3,.2),min.freq=3, max.words=Inf, random.order=FALSE, rot.per=.15, colors=brewer.pal(8,"Dark2")) ``` ###Ejemplo de comparación de varios textos ```{r} suppressWarnings(suppressMessages(library(wordcloud))) Discurso_Mujica_ONU <- suppressWarnings(paste(readLines("Discurso Mujica ONU.txt"), collapse=" ")) Discurso_Mujica_Casa_Blanca <- suppressWarnings(paste(readLines("Discurso Mujica Casa Blanca.txt"), collapse=" ")) Discurso_Despedida <- suppressWarnings(paste(readLines("Discurso Mujica Despedida Mando.txt"), collapse=" ")) tmpText <- data.frame(c(Discurso_Mujica_ONU, Discurso_Mujica_Casa_Blanca, Discurso_Despedida)) ds <- DataframeSource(tmpText) corp <- Corpus(ds) corp <- tm_map(corp,removePunctuation) corp <- tm_map(corp,tolower) corp <- tm_map(corp,removeNumbers) corp <- tm_map(corp, removeWords, stopwords("spanish")) corp <- tm_map(corp, PlainTextDocument) term.matrix <- TermDocumentMatrix(corp) term.matrix <- as.matrix(term.matrix) dim(term.matrix) colnames(term.matrix) <- c("Mujica ONU","Mujica Casa Blanca","Mujica Despedida") head(term.matrix) commonality.cloud(term.matrix,comonality.measure=min,max.words=Inf) comparison.cloud(term.matrix,max.words=Inf,random.order=FALSE,colors=brewer.pal(8,"Dark2"),scale=c(4,1),title.size = 1.5) #Solo con dos discursos Discurso_Mujica_Casa_Blanca <- suppressWarnings(paste(readLines("Discurso Mujica Casa Blanca.txt"), collapse=" ")) Discurso_Despedida <- suppressWarnings(paste(readLines("Discurso Mujica Despedida Mando.txt"), collapse=" ")) tmpText <- data.frame(c(Discurso_Mujica_Casa_Blanca, Discurso_Despedida)) ds <- DataframeSource(tmpText) corp <- Corpus(ds) corp <- tm_map(corp,removePunctuation) corp <- tm_map(corp,tolower) corp <- tm_map(corp,removeNumbers) corp <- tm_map(corp, removeWords, stopwords("spanish")) corp <- tm_map(corp, PlainTextDocument) term.matrix <- TermDocumentMatrix(corp) term.matrix <- as.matrix(term.matrix) dim(term.matrix) colnames(term.matrix) <- c("Mujica Casa Blanca","Mujica Despedida") head(term.matrix) commonality.cloud(term.matrix,comonality.measure=min,max.words=Inf) comparison.cloud(term.matrix,max.words=50,random.order=FALSE,colors=brewer.pal(8,"Dark2"),scale=c(1,1),title.size = 1.5) ```