Homepage » Ingyenes szoftver letöltések » Szöveg kivonása PDF és képfájlokból

    Szöveg kivonása PDF és képfájlokból

    Van egy PDF-dokumentum, amelyet ki szeretne venni a szövegből? Mi a helyzet egy olyan beolvasott dokumentum képfájljaival, amelyet szerkeszthető szöveggé kíván átalakítani? Ezek a leggyakoribb problémák, amelyeket a munkahelyen a fájlokkal végzett munka során láttam.

    Ebben a cikkben többféleképpen fogok beszélni arról, hogyan próbálhatunk ki egy PDF-ről vagy egy képből származó szöveget. A kivonási eredmények a PDF vagy a kép szövegének és minőségének függvényében változnak. Az eredmények az Ön által használt eszköztől függően is eltérőek lesznek, így a legjobb eredményeket a lehető legjobban próbálja ki az alábbi lehetőségek közül..

    Szöveg kivonása a képből vagy a PDF-ből

    A legegyszerűbb és leggyorsabb módja annak, hogy megpróbáljon egy online PDF szövegkivonó szolgáltatást. Ezek általában ingyenesek, és pontosan megadhatják, amit keresnek anélkül, hogy bármit telepítenének a számítógépére. Íme két olyan, amit nagyon jónak találtam a kiváló eredményekhez:

    ExtractPDF

    Az ExtractPDF egy ingyenes eszköz a képek, szövegek és betűtípusok megragadására a PDF fájlból. Az egyetlen korlátozás az, hogy a PDF fájl maximális mérete 10 MB. Ez egy kicsit kicsi; így ha nagyobb fájlja van, próbálkozzon az alábbi módszerekkel. Válassza ki a fájlt, majd kattintson a gombra Fájl küldése gomb. Az eredmények általában nagyon gyorsak, és a Szöveg fülre kattintva látni kell a szöveg előnézetét.

    Az is jó hozzáadott előny, hogy a képeket kivonja a PDF fájlból is, csak abban az esetben, ha szüksége van rájuk! Összességében az online eszköz nagyszerűen működik, de néhány PDF-dokumentumot futtattam, ami vicces eredményt ad. A szöveg csak finom lesz, de valamilyen oknál fogva minden szó után egy sorszakadás lesz! Nem rövid probléma a rövid PDF fájl esetében, de biztosan a sok szöveges fájlok problémája. Ha ez megtörténik, próbálja meg a következő eszközt.

    Online OCR

    Az online OCR rendszerint általában azon dokumentumoknál dolgozott, amelyek nem konvertáltak megfelelően az ExtractPDF-el, ezért jó ötlet, hogy mindkét szolgáltatást megpróbáljuk megnézni, hogy melyik a jobb kimenet. Az online OCR-nek néhány olyan szebb funkciója is van, amelyek hasznosak lehetnek bárki számára, aki olyan nagy PDF-fájlt használ, amely csak a néhány dokumentum helyett a szöveget konvertálja..

    Az első dolog, amit meg akarsz csinálni, egy szabad fiók létrehozása. Ez egy kicsit bosszantó, de ha nem hozza létre a szabad fiókot, akkor csak részben fogja konvertálni a PDF-t, nem pedig a teljes dokumentumot. Emellett ahelyett, hogy csak egy 5 MB-os dokumentumot tudott feltölteni, akár 100 MB-ot is feltölthet egy fájlra egy fiókkal.

    Először válasszon ki egy nyelvet, majd válassza ki az átalakított fájlhoz tartozó kimeneti formátumok típusát. Van néhány lehetőséged, és tetszés szerint többet is választhatsz. Alatt Többoldalas dokumentum, kiválaszthatja Oldalszámok majd válassza ki a konvertálni kívánt oldalakat. Ezután válassza ki a fájlt, majd kattintson a gombra Alakítani!

    A konverziót követően a Dokumentumok szakaszba kerül (ha bejelentkezett), ahol láthatja, hogy hány elérhető szabad oldal van, és linkeket töltött le az átalakított fájlok letöltéséhez. Úgy tűnik, mintha csak 25 oldala lenne szabad naponta, így ha többre van szüksége, akkor egy kicsit várnia kell, vagy több oldalt kell vásárolnia.

    Az online OCR kiváló munkát végzett a PDF-ek konvertálásában, mert képes volt fenntartani a szöveg tényleges elrendezését. A tesztem során egy Word-dokumentumot vettem fel, amelyen golyókat, különböző betűméreteket használtam stb. Ezután az Online OCR-t használtam vissza Word-formátumra, és körülbelül 95% -kal volt megegyezik az eredetivel. Ez elég lenyűgöző számomra.

    Továbbá, ha egy képet szöveget szeretne konvertálni, akkor az Online OCR ezt ugyanolyan könnyen elvégezheti, mint a szöveg PDF-fájlokból történő kinyerése.

    Ingyenes online OCR

    Mivel az OCR-ről szövegről beszéltek, hadd említsek meg egy másik jó weboldalt, amely nagyon jól működik a képeken. A Free Online OCR nagyon jó és nagyon pontos volt, amikor a tesztképeimből kivágott szöveget. Néhány fotót vettem az iPhone-ról a könyvekből, prospektusokból stb. Származó oldalakból, és meglepődtem, hogy milyen jól tudta átalakítani a szöveget.

    Válassza ki a fájlt, majd kattintson a Feltöltés gombra. A következő képernyőn van néhány lehetőség és egy kép előnézete. Meg lehet vágni, ha nem akarja, hogy OCR az egész dolog. Ezután kattintson az OCR gombra, és a konvertált szöveg a kép előnézete alatt jelenik meg. Nincs semmi korlátja, ami igazán szép.

    Az online szolgáltatások mellett két szabad PDF-átalakítót is megemlítek, ha a konverzió végrehajtásához helyileg a számítógépen futó szoftverre van szükség. Az online szolgáltatásokkal kapcsolatban mindig szüksége lesz egy internetkapcsolatra, és ez nem minden esetben lehetséges. Észrevettem azonban, hogy a freeware programokból származó konverziók minősége lényegesen rosszabb volt, mint a weboldalaké.

    A-PDF szövegkivonó

    A PDF-es PDF-dokumentum eltávolító ingyenes, ami meglehetősen jó munkát végez a PDF-fájlokból történő szövegkivitelhez. Ha letöltötte és telepítette, kattintson a Megnyitás gombra a PDF-fájl kiválasztásához. Ezután kattintson a Szöveg kivonása gombra a folyamat elindításához.

    Meg fogja kérni egy helyet a szöveges kimeneti fájl tárolására, majd elkezdi kitermelni. Kattinthat a választási lehetőség gomb, amely lehetővé teszi, hogy csak bizonyos oldalakat válasszon ki, és az extrahálás típusát. A második lehetőség érdekes, mert a szöveg különböző elrendezésekkel kivonja, és mindhárom érdemes megnézni, hogy melyik adja a legjobb kimenetet.

    PDF2Text Pilot

    A PDF2Text Pilot okos munkát végez a szöveg kinyerésében. Nincs lehetősége; csak fájlokat vagy mappákat ad, konvertál és remélhet a legjobbra. Néhány PDF-en jól működött, de többségükben számos kérdés volt.

    Csak kattintson a Fájlok hozzáadása gombra, majd kattintson a gombra Alakítani. A konverzió befejezése után kattintson a Tallózás gombra a fájl megnyitásához. A kilométered ezzel a programmal változik, így nem várhatsz sokat.

    Azt is érdemes megemlíteni, hogy ha vállalati környezetben vagy az Adobe Acrobat másolatán munkát kap, akkor valóban sokkal jobb eredményeket érhet el. Az Acrobat nyilvánvalóan nem ingyenes, de lehetőségei vannak a PDF konvertálására Word, Excel és HTML formátumban. A legjobb feladat az eredeti dokumentum szerkezetének megőrzése és a bonyolult szöveg konvertálása.