Homepage » hogyan kell » Hogyan lehet átalakítani PDF fájlt szerkeszthető szöveggé, a Linux parancssori használatával

    Hogyan lehet átalakítani PDF fájlt szerkeszthető szöveggé, a Linux parancssori használatával

    Számos oka lehet annak, hogy a PDF-fájlt szerkeszthető szöveggé alakíthatja át. Lehet, hogy felül kell vizsgálnia egy régi dokumentumot, és mindössze a PDF-verziója van. A PDF-fájlok konvertálása Windows-ban egyszerű, de mi van, ha Linuxot használ?

    Semmi gond. Megmutatjuk, hogyan lehet a PDF-fájlokat szerkeszthető szöveggé konvertálni a pdftotext nevű parancssori eszközzel, amely a „poppler-utils” csomag része. Ez az eszköz már telepítve van. Annak ellenőrzéséhez, hogy a pdftotext telepítve van-e a rendszeren, nyomja meg a „Ctrl + Alt + T” gombot a terminálablak megnyitásához. Írja be a következő parancsot a parancssorba, és nyomja meg az „Enter” gombot.

    dpkg -s poppler-utils

    MEGJEGYZÉS: Ha azt mondjuk, hogy írunk valamit a cikkbe, és vannak idézőjelek a szöveg körül, NE írja be az idézőjeleket, hacsak nem adjuk meg másként.

    Ha a pdftotext nincs telepítve, írja be a következő parancsot a parancssorba, és nyomja meg az „Enter” gombot.

    sudo apt-get install poppler-utils

    Írja be a jelszót, amikor kéri, majd nyomja meg az „Enter” gombot.

    A poppler-utils csomagban számos eszköz áll rendelkezésre a PDF különböző formátumokra történő konvertálására, a PDF-fájlok manipulálására és az adatok fájlból történő kivonására.

    Az alábbiakban az alapvető parancs egy PDF-fájl szerkeszthető szövegfájlra történő konvertálására szolgál. Nyomja meg a „Ctrl + Alt + T” gombot a terminálablak megnyitásához, írja be a parancsot a parancssorba, majd nyomja meg az „Enter” gombot.

    pdftotext /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

    Módosítsa az egyes fájlok elérési útját, hogy megfeleljen az eredeti PDF-fájl helyének és nevének, és hol kívánja elmenteni a kapott szövegfájlt. Változtassa meg a fájlneveket is, hogy megfeleljen a fájlok nevének.

    A szövegfájl létrehozása és megnyitása ugyanúgy megnyitható, mint bármely más szöveges fájl megnyitása Linux alatt.

    A konvertált szöveg sorokban törhet olyan helyeken, ahol nem szeretne. A sortörések a PDF-fájl minden szövege után kerülnek beillesztésre.

    A dokumentum (fejlécek, láblécek, lapozás stb.) Elrendezését megőrizheti az átalakított szövegfájl eredeti PDF-fájljából a „-layout” jelzővel.

    pdftotext -layout /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

    Ha csak egy PDF fájlból álló oldalt szeretne konvertálni, használja a „-f” és a „-l” (kisbetűs „L”) jelzőket az átalakítani kívánt tartomány első és utolsó oldalának megadásához..

    pdftotext -f 5 -1 9 /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

    A tulajdonos jelszóval védett és titkosított PDF-fájl konvertálásához használja a „-opw” jelzőt (a zászló első karaktere egy „O” kisbetű, nem nulla).

    pdftotext -opw 'jelszó' /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

    Változtassa meg a „jelszót” az eredeti konvertálandó PDF-fájl védelméhez használt értékre. Győződjön meg róla, hogy vannak-e egyszeri idézőjelek, nem pedig a „jelszó”.

    Ha a PDF-fájlt egy felhasználói jelszóval védi és titkosítja, használja a „-ww” jelzést a „-opw” jelzés helyett. A parancs többi része ugyanaz.

    Megadhatja azt is, hogy milyen típusú vége legyen az átalakított szövegnek. Ez különösen akkor hasznos, ha a fájlt egy másik operációs rendszeren kívánja elérni, mint például a Windows vagy a Mac. Ehhez használja a „-eol” jelzőt (a jelző középső karaktere egy „O” kisbetű, nem nulla), amelyet egy szóköz és a használni kívánt végpont-karakter típusa követ (“ unix "," dos "vagy" mac ").

    MEGJEGYZÉS: Ha nem ad meg fájlnevet a szövegfájlhoz, a pdftotext automatikusan használja a PDF fájlnév alapját, és hozzáadja a „.txt” kiterjesztést. Például a „file.pdf” fájl „file.txt” -re kerül. Ha a szövegfájl „-” -ként van megadva, akkor az átalakított szöveg stdout-ra kerül, ami azt jelenti, hogy a szöveg megjelenik a terminál ablakban, és nem kerül mentésre egy fájlba.

    A terminálablak bezárásához kattintson a bal felső sarokban lévő „X” gombra.

    A pdftotext paranccsal kapcsolatos további információkért írja be a „man page pdftotext” parancsot a terminálablakban található parancssorba.