Exploratory Data Analisys con R

Exploratory Data Analisys con R

R
Exploratory Data Analisys con R Llamamos Análisis Exploratorio de Datos (acrónimo EDA del inglés) al proceso inicial de reconocimiento o, lo que sencillamente entendemos como echar un vistazo a los datos y así empezar a comprender un poco lo que contienen y qué se puede hacer con ellos. He dividido el artículo en 3 partes, en la primera vemos “lo básico” e imprescindible que son las funciones de RBase para echar un vistazo a los datos tabulados.

Función sílabas

El año pasado hice un programaita simple para ayudar a los pequeños poetas, lo llamé rimador. Se trataba de escribir una palabra y el programa buscaba otras con la misma terminación o rima, según algunos parámetros. Así, podías buscar palabras que rimaran solo en las vocales últimas o en rima exacta consonante. El caso es que no encontré ningún paquete, ni función con el que calcular la división en sílabas en español y que permita calcular estas rimas.
Árboles con funciones recursivas

Árboles con funciones recursivas

Arte generativo con R Hace un par de post hablamos de la generación de números aleatorios ver aquí. Hoy vuelvo a insistir en este tema fascinante que me embruja sin remedio. En cierta forma, lo que me atrae es la belleza del caos, la sorpresa de ver cómo una sucesión espontánea y aleatoria de números puede llegar a transformarse en imágenes de objetos cotidianos y naturales. Esto es especialmente visible en los seres vivos, que muestran una geometría compleja, caótica aunque en ella subyace un ritmo matemático, caótico, fractal.
leer tabla en pdf

leer tabla en pdf

R
Vamos a ver cómo leer un documento pdf desde R con la librería pdftools. Se trata de un paquete interesante para leer pdf vectoriales, es decir, los que contienen texto vectorizado, esto no nos vale para archivos pdf tipo imagen, que son aquellos que -aunque contengan texto-, este se guarda como imagen sin vectorizar. En estos casos hay otras librerías que hacen el OCR, conversión y lectura previo necesario, como tabulazer o la librería imageR, aunque necesitas tener Java para esto los resultados son espectaculares.
Generación aleatoria

Generación aleatoria

R
Generación de series aleatorias A veces, necesitamos crear series de datos “inventados” para comprobar modelos, estudios o hipótesis. La generación aleatoria es un tema interesante y útil por lo que he recopilado en este artículo diferentes métodos sencillos que uso para crear series de datos “de la nada”. Se trata de simples funciones de Rbase con las que podemos generar series aleatorias o secuencias con propiedades predefinidas, imprescindibles para validación de modelos.
Unir varias gráficas en una

Unir varias gráficas en una

Unir gráficas con R Seguro que alguna vez has necesitado juntar varias gráficas hechas con R y has acabado uniéndolas en un programa de diseño de imagen (estilo photoshop, paint…) en vez de seguir con R. Hace unos días tenía que escribir un informe y no me convencía poner cada gráfico por separado pues estaban relacionados, me acordé que un día había usado una librería de R para esto (cowplot) y ya puestos en materia acabé descubriendo patchwork que es, como dicen en su propia web, ridículamente simple y justo lo que necesitaba.

Cómo actualizar el blog

Actualizar el Rblog Empecé este Rblog hace 2 años y medio, el tiempo pasa rápido y esto en cosas informáticas es además una carga adicional de trabajo, pues cuando ya tienes un flujo de trabajo apañado, aparecen actualizaciones de seguridad, cambios de formatos etc, que hacen que pase la mayor parte del tiempo dedicado al blog cosiendo remiendos para que la máquina siga funcionando. Hasta este lluvioso fin de semana de mayo, que me he cansado y he decidido tirar el pantalón viejo y comprar unos nuevos.
Office desde R

Office desde R

Hoy no voy a convencer a nadie de las ventajas y maravillas de usar R en el trabajo diario, incluso para la generación de documentos, informes y cartas… no, hoy no, la batalla está perdida desde hace tiempo, pero al menos vamos a alumbrar una opción para domar a la bestia directamente desde sus entrañas, pues desde R vamos a poder generar documentos del paquete para oficinas más extendido.
R logos con HexSticker

R logos con HexSticker

Cuando hice el logo del blog no sabía que existía un paquete dedicado a esto de hacer logos hexagonales en R, así que lo diseñé con un programa gráfico al estilo “tradicional”. El ecosistema de R está creciendo tan rápido que hoy día podemos encontrar librerías para TODO, incluso para pintar nuestro logo hexagonal sin salir del entorno del programa. Preparad vuestra imaginación que hoy vamos a hablar de la librería hexSticker con la que vamos a diseñar unos cuantos logos.
Mapa urbano

Mapa urbano

Me gustó mucho un mapa leí en el blog de Dominic Royé y que muestra la evolución urbana de Valencia. No me he podido resistir a replicarlo para mi querida perla del Segura, Cieza (Murcia). Además de un estupendo blog dedicado a temas de clima y geografía, Dominic Royé ha escrito un libro titulado “INTRODUCCIÓN A LOS SIG CON R”, que tiene muy buena pinta, y que comentaré cuando lo tenga en la mano y lea, espero que pronto.