Hogyan lehet átalakítani PDF fájlt szerkeszthető szöveggé, a Linux parancssori használatával
Számos oka lehet annak, hogy a PDF-fájlt szerkeszthető szöveggé alakíthatja át. Lehet, hogy felül kell vizsgálnia egy régi dokumentumot, és mindössze a PDF-verziója van. A PDF-fájlok konvertálása Windows-ban egyszerű, de mi van, ha Linuxot használ?
Semmi gond. Megmutatjuk, hogyan lehet a PDF-fájlokat szerkeszthető szöveggé konvertálni a pdftotext nevű parancssori eszközzel, amely a „poppler-utils” csomag része. Ez az eszköz már telepítve van. Annak ellenőrzéséhez, hogy a pdftotext telepítve van-e a rendszeren, nyomja meg a „Ctrl + Alt + T” gombot a terminálablak megnyitásához. Írja be a következő parancsot a parancssorba, és nyomja meg az „Enter” gombot.
dpkg -s poppler-utils
MEGJEGYZÉS: Ha azt mondjuk, hogy írunk valamit a cikkbe, és vannak idézőjelek a szöveg körül, NE írja be az idézőjeleket, hacsak nem adjuk meg másként.
Ha a pdftotext nincs telepítve, írja be a következő parancsot a parancssorba, és nyomja meg az „Enter” gombot.
sudo apt-get install poppler-utils
Írja be a jelszót, amikor kéri, majd nyomja meg az „Enter” gombot.
A poppler-utils csomagban számos eszköz áll rendelkezésre a PDF különböző formátumokra történő konvertálására, a PDF-fájlok manipulálására és az adatok fájlból történő kivonására.
Az alábbiakban az alapvető parancs egy PDF-fájl szerkeszthető szövegfájlra történő konvertálására szolgál. Nyomja meg a „Ctrl + Alt + T” gombot a terminálablak megnyitásához, írja be a parancsot a parancssorba, majd nyomja meg az „Enter” gombot.
pdftotext /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt
Módosítsa az egyes fájlok elérési útját, hogy megfeleljen az eredeti PDF-fájl helyének és nevének, és hol kívánja elmenteni a kapott szövegfájlt. Változtassa meg a fájlneveket is, hogy megfeleljen a fájlok nevének.
A szövegfájl létrehozása és megnyitása ugyanúgy megnyitható, mint bármely más szöveges fájl megnyitása Linux alatt.
A konvertált szöveg sorokban törhet olyan helyeken, ahol nem szeretne. A sortörések a PDF-fájl minden szövege után kerülnek beillesztésre.
A dokumentum (fejlécek, láblécek, lapozás stb.) Elrendezését megőrizheti az átalakított szövegfájl eredeti PDF-fájljából a „-layout” jelzővel.
pdftotext -layout /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt
Ha csak egy PDF fájlból álló oldalt szeretne konvertálni, használja a „-f” és a „-l” (kisbetűs „L”) jelzőket az átalakítani kívánt tartomány első és utolsó oldalának megadásához..
pdftotext -f 5 -1 9 /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt
A tulajdonos jelszóval védett és titkosított PDF-fájl konvertálásához használja a „-opw” jelzőt (a zászló első karaktere egy „O” kisbetű, nem nulla).
pdftotext -opw 'jelszó' /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt
Változtassa meg a „jelszót” az eredeti konvertálandó PDF-fájl védelméhez használt értékre. Győződjön meg róla, hogy vannak-e egyszeri idézőjelek, nem pedig a „jelszó”.
Ha a PDF-fájlt egy felhasználói jelszóval védi és titkosítja, használja a „-ww” jelzést a „-opw” jelzés helyett. A parancs többi része ugyanaz.
Megadhatja azt is, hogy milyen típusú vége legyen az átalakított szövegnek. Ez különösen akkor hasznos, ha a fájlt egy másik operációs rendszeren kívánja elérni, mint például a Windows vagy a Mac. Ehhez használja a „-eol” jelzőt (a jelző középső karaktere egy „O” kisbetű, nem nulla), amelyet egy szóköz és a használni kívánt végpont-karakter típusa követ (“ unix "," dos "vagy" mac ").
MEGJEGYZÉS: Ha nem ad meg fájlnevet a szövegfájlhoz, a pdftotext automatikusan használja a PDF fájlnév alapját, és hozzáadja a „.txt” kiterjesztést. Például a „file.pdf” fájl „file.txt” -re kerül. Ha a szövegfájl „-” -ként van megadva, akkor az átalakított szöveg stdout-ra kerül, ami azt jelenti, hogy a szöveg megjelenik a terminál ablakban, és nem kerül mentésre egy fájlba.
A terminálablak bezárásához kattintson a bal felső sarokban lévő „X” gombra.
A pdftotext paranccsal kapcsolatos további információkért írja be a „man page pdftotext” parancsot a terminálablakban található parancssorba.