viernes, 15 de junio de 2012

PDF en terminal

Cada día me gusta más el terminal. Estos días mis compañeros están generando una gran cantidad de documentación que ha de ser justificada a través de documentos electrónicos con formato PDF. En un momento determinado nos hemos encontrado con una gran cantidad de material escaneado con formato jpg. El cambio a PDF parecía que iba a ser largo y costoso en tiempo, pero en Linux todo es posible. Una simple orden en terminal

convert *.jpg documentacion.pdf

y todos los PDF estaban en un fichero PDF, página a página y perfectamente transformado, en unos 20 segundos. convert es un comando de imagemagick; si no estuviera disponible, simplemente instalar el paquete imagemagick.
Además, por la tarde surgió la necesidad de extraer unas imágenes desde un PDF. En mis apuntes encontré la orden pdfimages; una simple orden

pdfimages -j fichero.pdf nombre

y todas las imágenes del pdf salen en orden, numeradas como nombre-1.jpg, nombre-2.jpg ... La opción -j es la que permite que salgan como jpg, ya que si no saldrían con formato ppm. pdfimages forma parte del paquete poppler-utils. Ambos paquetes suelen estar instalados en la mayor parte de las distribuciones, pero si no es así, es un simple

Los debianos (multitud de ubunteros incluidos),
sudo apt-get install imagemagick poppler-utils

Los de Fedora
yum install imagemagick poppler-utils

y otras muchas posibilidades, incluso gráficas. Recomendable la lectura de los manuales de los comandos, ya que las posibilidades, sobre todo de convert, son casi infinitas.

1 comentario: