Hogyan készítsünk képeket a PDF fájlból a Linux rendszerben?
A „pdftotext” parancssori eszközzel könnyedén konvertálhatja a PDF-fájlokat szerkeszthető szöveggé. Ha azonban vannak eredeti képek az eredeti PDF-fájlban, akkor azok nem kerülnek kivonásra. Ha PDF-fájlból szeretné kinyerni a képeket, használhat egy másik parancssori eszközt, a „pdfimages” -t..
MEGJEGYZÉS: Ha azt mondjuk, hogy írunk valamit a cikkbe, és vannak idézőjelek a szöveg körül, NE írja be az idézőjeleket, hacsak nem adjuk meg másként.
A „pdfimages” eszköz a poppler-utils csomag része. Ellenőrizheti, hogy telepítve van-e a rendszeren, és telepítse, ha szükséges, az ebben a cikkben leírt lépésekkel.
A PDF-fájlokból a PDFimages segítségével történő kivonáshoz nyomja meg a „Ctrl + Alt + T” gombot a terminálablak megnyitásához. Írja be a következő parancsot a parancssorba.
pdfimages /home/lori/Documents/SampleWithImages.pdf / home / lori / Dokumentumok / ExtractedImages / image
MEGJEGYZÉS: Az ebben a cikkben bemutatott összes parancsra cserélje ki a parancs első útvonalát és a PDF fájlnevet az eredeti PDF fájl elérési útjára és fájlnevére. A második útvonalnak azt a gyökérmappát kell elérnie, amelybe menteni kívánja a kivont képeket. A második kép végén a „image” szó képviseli azt, amit a fájlnevével szeretne előhívni. A képek fájlnevét automatikusan számozzák (000, 001, 002, 003, stb.). Ha szöveget szeretne hozzáadni minden kép elejéhez, írja be a szöveget a második út végén. Példánkban minden képfájl neve „image” -vel kezdődik, mint például a image-001.ppm, image-002.ppm stb. A megadott szöveg és a szám között egy kötőjel kerül hozzáadásra..
Az alapértelmezett képformátum a PPM (hordozható pixmap) a nem monokróm képekhez, vagy a PBM (hordozható bitkép) a monokróm képekhez. Ezeket a formátumokat úgy tervezték, hogy könnyen cserélhessék a platformokat.
MEGJEGYZÉS: A PDF-fájlban minden egyes képhez két képfájlt kaphat. Az egyes képek második képe üres, ezért meg tudja mondani, hogy mely képeket tartalmazzák a fájlból a képek a Fájlkezelőben található fájl miniatűrjével..
A .jpg képfájlok létrehozásához adja hozzá a „-j” opciót a parancshoz, ahogy az alább látható.
pdfimages -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Dokumentumok / ExtractedImages / image
MEGJEGYZÉS: Az alapértelmezett kimenetet PNG-re is módosíthatja a „-png” opció vagy a TIFF használatával a „-tiff” opció használatával.
Az egyes képek fő képfájlja .jpg fájlként kerül mentésre. A második üres kép továbbra is .ppm vagy .pbm fájl.
Ha csak bizonyos oldalakon szeretné konvertálni a képeket, használja a „-f” opciót egy számmal, hogy jelezze az első konvertálandó oldalt, amint az az alábbi példában látható..
pdfimages -f 2 -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Dokumentumok / ExtractedImages / image
MEGJEGYZÉS: A „-j” opciót a „-f” opcióval kombináltuk, így a .jpg képeket kapnánk, és ugyanezt tennénk az alábbi „l” opcióval is.
Ahhoz, hogy az összes képet egy bizonyos oldal előtt és egy másik oldalára konvertálja, használja az „-l” (kis „L”, nem pedig „1”) opciót egy számmal, hogy jelezze az utolsó konvertálandó oldalt, az alábbi ábra szerint.
pdfimages -l 1 -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Dokumentumok / ExtractedImages / image
MEGJEGYZÉS: A „-f” és az „-l” opciókat együttesen használhatja a dokumentum közepén lévő adott oldaltartományban lévő képek konvertálásához.
Ha van egy tulajdonos jelszó a PDF-fájlban, használja az „-opw” opciót és a jelszót egyetlen idézőjelben, ahogy az alább látható. Ha a PDF-fájl jelszava felhasználói jelszó, akkor a jelszóval használja a „-upw” opciót.
MEGJEGYZÉS: Győződjön meg róla, hogy a paranccsal vannak egy-egy idézőjel a parancsban.
pdfimages -opw 'password' -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Dokumentumok / ExtractedImages / image
A pdfimages parancs használatával kapcsolatos további információkért írja be a „pdfimages” parancsot a terminálablakban, majd nyomja meg az „Enter” gombot. A parancshasználat a parancsban használható opciók listájával jelenik meg.