Extreure imatges d’un pdf en un pas (Linux)

Un client ens ha facilitat el seu catàleg en pdf per tal que li realitzem el disseny web . Per extreure poques imatges ho podríem fer amb el gimp, però quan parlem de més de 300 cal cercar una altre solució.

La majoria de distribucions de Linux porten inclosa una aplicació de consola anomenada pdfimages.

Amb una línia podem extreure totes les imatges:

pdfimages -j arxiu.pdf images

Amb la opció -j aconseguim que ens guardi les imatges  DCT (Discrete cosine transform) com a jpg. Les que no siguin DCT les guardarà en format  PPM.

Per transformar les imatges PPM a jpg només cal que utilitzem una altre aplicació de consola:  imagemagick

convert *.ppm image%d.jpg

Amb aquestes dues ordres ja tenim totes les imatges extretes i convertides a jpg.

Si ho haguéssim de fer molt sovint, podríem crear un script i afegir-lo al botó dret del nautilus o fins i tot cercar si algú ja l’ha fet a http://g-scripts.sourceforge.net/ , on podeu trobar una col·lecció d’scripts pel nautilus.

Obrir el xat
Hola 👋
Us podem ajudar?