Tesseract.js A kép OCR fordítása a böngészőkhöz
Az OCR fordítás még mindig nem tökéletes, de az elmúlt években jelentősen javult. Az út vezetője a Tesseract fordítómotor jelenleg nyitva van C++.
Habár ez hihetetlen könyvtár, ez azonban csak szoftverekre korlátozódik. Szerencsére valaki Tesseract portot adott a JavaScript-be, amelyet Tesseract.js néven hívnak. Azt legfeljebb 60 nyelvet támogat és bár ez biztosan nem tökéletes, jól működik.
A telepítés és a beállítás egyszerű, ahol lehet bármilyen képelemet céloz az oldalon, és futtassa a Tesseract.recognize () funkció. Ez bármilyen típusú képet hozhat, és automatikusan fog megjelenni tömöríteni és lefordítani közvetlenül a böngészőben.
Sokkal bonyolultabb, de a szépség hogyan lehet futtatni az OCR-t egyetlen kódsorral.
Nézze meg a Tesseract.js céloldalát, ha élő demót szeretne látni. Ez jól működik a böngészőben, ahol lehet húzza át a szkennelt képeket a szöveg automatikus OCR-fordításához.
A példát a GitHub oldalról is letöltheti, vagy saját alkalmazást hozhat létre a Tesseract.js parancsfájljának CDN-ből történő hozzáadásával.
A legegyszerűbb kódpélda a következőképpen néz ki myImage közvetlen hivatkozás egy HTML képelemre:
Tesseract.recognize (myImage) .then (függvény (eredmény) console.log (results));
Akárhogy is, ez a könyvtár annyira hasznos, hogy az OCR-n keresztül mozogjon az interneten. Ez messze nem tökéletes, de az is legjobb erőforrás a webes fejlesztők számára, akik dinamikus oldal-OCR-funkciókat akarnak.
További információért látogasson el a Tesseract.js GitHub oldalra, ahol megtekintheti az élő bemutatót, és böngészhet az online dokumentációban.