Vamos a ver cómo leer un documento pdf desde R con la librería pdftools. Se trata de un paquete interesante para leer pdf vectoriales, es decir, los que contienen texto vectorizado, esto no nos vale para archivos pdf tipo imagen, que son aquellos que -aunque contengan texto-, este se guarda como imagen sin vectorizar. En estos casos hay otras librerías que hacen el OCR, conversión y lectura previo necesario, como tabulazer o la librería imageR, aunque necesitas tener Java para esto los resultados son espectaculares.
El mes pasado (dic-2019) me dio por zanjar uno de mis objetivos del año, o más bien de los últimos años, que había estado retrasando por pura vagancia (procrastinación para los anglofilos), y es que llevo tiempo detrás de sacar un libro que ya estaba escrito, pero faltaba editar, componerlo y mandar a imprimir los ejemplares.
Se trata de una historia familiar, y gracias a este trabajo navideño he tenido - otra vez - que ponerme las pilas en cuestión de edición de documentos largos en R (tipo tesis) y el resultado ha sido muy satisfactorio.
Con el último artículo he aprovechado para actualizar RSTUDIO y de paso, probar TinyTeX la versión de \(\LaTeX\) ligera para R que ha hecho Yihui Xie.
La verdad que, hasta ahora me he apañado bien con MikTeX, pero esta versión de \(\LaTeX\) requiere cierta paciencia y un aprendizaje que no todo el mundo es capaz de sacrificar para la utilidad que obtiene, por eso la idea de una versión de \(\LaTeX\) sencilla y manejable desde R me pareció fantástica y esa es TinyTeX.
Suelo trabajar con unos modelos de proyecto tipo para generar documentos. Cuando inicio un nuevo proyecto los copio y cambio cosas sobre estas plantillas.
Hoy quería hacer un documento en formato pdf con salida en dos columnas. Es algo que ya había necesitado antes, así que me puse a buscar.