5 ingyenes online OCR szolgáltatás tesztelve és áttekintve
Van PDF-dokumentum vagy olyan kép, amelyet szöveget szeretne átalakítani? A közelmúltban valaki küldött nekem egy dokumentumot a levélben, amelyet szerkeszteni és visszaigazolni kell. A személy nem tudott digitális példányt találni, ezért feladatom volt, hogy az összes szöveget digitális formátumba vegyük.
Nem volt mód arra, hogy órákat töltsek be mindent visszaírva, így végül egy jó minőségű képet készítettem a dokumentumról, majd az online OCR-szolgáltatások egy csomóját égettem, hogy lássam, melyik lenne a legjobb eredmények.
Ebben a cikkben néhány kedvenc webhelyemen megyek keresztül, amelyek ingyenesek az OCR-nek. Érdemes megjegyezni, hogy ezek a webhelyek többsége alapvető ingyenes szolgáltatást nyújt, és akkor fizetett lehetőségeket, ha olyan extra szolgáltatásokat szeretne, mint a nagyobb képek, többoldalas PDF dokumentumok, különböző beviteli nyelvek stb..
Az is jó tudni, hogy a legtöbb ilyen szolgáltatás nem lesz képes az eredeti dokumentum formázására. Ezek elsősorban a szövegek kitermelésére szolgálnak, és ez az. Ha mindent meg kell adnia egy adott elrendezésben vagy formátumban, akkor manuálisan kell ezt elvégeznie, miután megkapta az összes szöveget az OCR-től.
Ezen túlmenően a legjobb eredmények a szövegszerzéshez a 200-400 DPI felbontású dokumentumokból származnak. Ha alacsony DPI képe van, az eredmények nem lesznek olyan jóak.
Végül, rengeteg webhely volt, amit teszteltem, ami nem működött. Ha a Google ingyenes online OCR-t lát, egy csomó webhelyet fog látni, de a 10 legjobb eredmény több webhelye még nem fejezte be a konverziót. Némelyik időzített, más hibákat adna, és néhány csak megállt a „konvertáló” oldalon, így nem is törődtem az említett webhelyek megemlítésével.
Minden egyes helyszínen két dokumentumot teszteltem, hogy lássam, milyen jól lehet a kimenet. Vizsgálataimhoz egyszerűen használtam az iPhone 5S készülékemet, hogy képeket készítsek mindkét dokumentumról, majd feltöltöttem őket közvetlenül a konverziós webhelyekre.
Abban az esetben, ha szeretné megnézni, hogy milyen képeket láttam a tesztemhez, itt csatoltam őket: Test1 és Test2. Ne feledje, hogy ezek nem a telefonról készített képek teljes felbontású verziói. A teljes felbontású képet az oldalakra való feltöltéskor használtam.
OnlineOCR
Az OnlineOCR.net egy tiszta és egyszerű webhely, amely nagyon jó eredményeket nyújtott a tesztemben. A legfontosabb dolog az, hogy nem rendelkezik tonna hirdetésekkel az egész helyen, ami általában az ilyen típusú niche-szolgáltatási oldalak esetében van..
Elindításához válassza ki a fájlt, és várja meg, amíg befejezi a feltöltést. A webhely maximális feltöltési mérete 100 MB. Ha regisztrálsz egy ingyenes fiókra, néhány további funkciót kapsz, mint például a nagyobb feltöltési méret, többoldalas PDF-fájlok, különböző beviteli nyelvek, több konverzió óránként stb..
Ezután válassza ki a beviteli nyelvet, majd válassza ki a kimeneti formátumot. Választhat a Word, az Excel vagy a Sima szöveg közül. Kattints a Alakítani gomb, és a doboz alján látható szöveg jelenik meg a letöltési hivatkozással együtt.
Ha csak a szöveget akarja, akkor csak másolja és illessze be azt a dobozból. Azonban javaslom, hogy töltsd le a Word dokumentumot, mert meglepően nagyszerű feladat az eredeti dokumentum elrendezésének megtartása.
Például, amikor megnyitottam a Word-dokumentumot a második teszthez, meglepődtem, hogy a dokumentum három oszlopot tartalmazó táblázatot tartalmazott, mint a képen..
Az összes oldalról ez volt a legjobb. Teljesen érdemes regisztrálni, ha sok konverziót kell tennie.
A teljesség érdekében az egyes szolgáltatások által létrehozott kimeneti fájlokat is összekapcsolom, így láthatod az eredményeket magadnak. Íme az OnlineOCR: Test1 Doc és Test2 Doc.
Ne feledje, hogy amikor megnyitja ezeket a Word-dokumentumokat a számítógépén, egy üzenetet kap a Word-ben, amely szerint az internetről van szó, és a szerkesztés le van tiltva. Ez teljesen rendben van, mert a Word nem bízik az internetről érkező dokumentumokban, és valójában nem kell engedélyezni a szerkesztést, ha csak a dokumentumot szeretné megtekinteni.
i2OCR
Az i2OCR egy másik oldal, amely elég jó eredményeket adott. A folyamat nagyon hasonló: válassza ki a nyelvet, a fájlt, majd nyomja meg a gombot Szöveg kivonása.
Itt kell várni egy-két percet, mert ez az oldal egy kicsit hosszabb ideig tart. A 2. lépésben is győződjön meg róla, hogy a kép jobb oldali oldallal jelenik meg az előnézetben, különben egy csomó gibberishet kap a kimenetként. Valamilyen oknál fogva az iPhone-os képeket portrék módban mutatták be a számítógépemen, de a tájképet, amikor feltöltöttem ezt a webhelyet.
Manuálisan kellett megnyitnom a képet egy fotószerkesztő alkalmazásban, 90 fokkal el kell forgatnom, majd vissza kell állítanom a portrét, majd újra menteni. Ha elkészült, lapozzunk lefelé, és a letöltés gombjával együtt megjelenik a szöveg előnézete.
Ez az oldal elég jól sikerült az első teszt kimenetével, de nem tette meg jól ezt a második tesztet, amely az oszlop elrendezést kapott. Íme az i2OCR: Test1 Doc és Test2 Doc.
FreeOCR
A Free-OCR.com a képeket átveszi és egyszerű szöveggé konvertálja. Nincs lehetősége a Word formátumba exportálására. Válassza ki a fájlt, jelöljön ki egy nyelvet, majd kattintson a gombra Rajt.
Az oldal gyors, és a kimenet meglehetősen gyorsan kap. Csak kattintson a linkre a szövegfájl számítógépre való letöltéséhez.
Mint az alábbiakban leírt NewOCR-hez hasonlóan, ez a webhely a dokumentum összes T-jét használja ki. Fogalmam sincs, hogy miért tenné ezt, de néhány furcsa oknál fogva ez a webhely és a NewOCR mindezt megtette. Nem nagy dolog változtatni, de ez egy unalmas folyamat, amit tényleg nem kell tennie.
Íme a FreeOCR: Test1 Doc és Test2 Doc.
ABBYY FineReader Online
A FineReader Online használatához regisztrálnia kell egy fiókot, amely 15 napos ingyenes próbaverziót biztosít az OCR-hez, akár 10 oldal ingyenes. Ha csak néhány oldalt kell egyszerre elvégeznie az OCR-t, akkor ezt a szolgáltatást használhatja. Győződjön meg róla, hogy a regisztrációs e-mailben kattintson a megerősítő hivatkozásra.
Kattintson Elismerik tetején, majd kattintson a gombra Feltöltés a fájl kiválasztásához. Válassza ki a nyelvet, a kimeneti formátumot, majd kattintson a gombra Elismerik az alján. Ez az oldal tiszta felületet és hirdetéseket nem tartalmaz.
Kísérleteimben ez az oldal képes volt megragadni az első tesztdokumentumból származó szöveget, de ez teljesen óriási volt, amikor kinyitottam a Word doc-et, így végül újra végeztem, és a Plain Text-t választottam kimeneti formátumként.
A második teszt az oszlopokkal, a Word dokumentum üres volt, és még nem találtam meg a szöveget. Nem biztos benne, hogy mi történt ott, de úgy tűnik, nem képes más egyszerű dolgokat kezelni. Íme a FineReader eredményei: Test1 Doc és Test2 Doc.
NewOCR
A következő webhely, NewOCR.com, rendben volt, de nem volt olyan jó, mint az első oldal. Először is van hirdetése, de szerencsére nem egy tonna. Először válassza ki a fájlt, majd kattintson a gombra Előnézet gomb.
Ezután elforgathatja a képet, és beállíthatja a keresendő területet. Ez nagyon hasonlít arra, hogyan működik a szkennelési folyamat a számítógéphez csatlakoztatott szkennerrel.
Ha a dokumentum több oszlopot tartalmaz, ellenőrizheti a Oldalelrendezési elemzés gomb, és megpróbálja megosztani a szöveget oszlopokra. Kattintson az OCR gombra, várjon néhány másodpercet, amíg befejeződik, majd görgessen lefelé az alsó oldalra, amikor az oldal frissül.
Az első tesztben az összes szöveget helyesen kapta, de valamilyen oknál fogva a dokumentum minden T-t kapitalizálta! Nem tudom, miért tenné ezt, de nem. A második tesztben az oldalelemzés engedélyezve volt a legtöbb szöveg, de az elrendezés teljesen ki volt kapcsolva.
Íme a NewOCR: Test1 Doc és Test2 Doc.
Következtetés
Amint láthatjuk, az ingyenes nem igazán ad jó eredményeket a legtöbb esetben sajnos. Az első említett oldal messze a legjobb, mert nemcsak nagyszerű munkát végzett a szöveg felismerésében, hanem sikerült megőrizni az eredeti dokumentum formátumát.
Ha azonban csak szövegre van szüksége, a fenti weboldalak többségének képesnek kell lennie erre. Ha bármilyen kérdése van, ne habozzon megjegyzést tenni. Élvez!