Tesseract.js A kép OCR fordítása a böngészőkhöz

Az OCR fordítás még mindig nem tökéletes, de az elmúlt években jelentősen javult. Az út vezetője a Tesseract fordítómotor jelenleg nyitva van C++.

Habár ez hihetetlen könyvtár, ez azonban csak szoftverekre korlátozódik. Szerencsére valaki Tesseract portot adott a JavaScript-be, amelyet Tesseract.js néven hívnak. Azt legfeljebb 60 nyelvet támogat és bár ez biztosan nem tökéletes, jól működik.

A telepítés és a beállítás egyszerű, ahol lehet bármilyen képelemet céloz az oldalon, és futtassa a Tesseract.recognize () funkció. Ez bármilyen típusú képet hozhat, és automatikusan fog megjelenni tömöríteni és lefordítani közvetlenül a böngészőben.

Sokkal bonyolultabb, de a szépség hogyan lehet futtatni az OCR-t egyetlen kódsorral.

Nézze meg a Tesseract.js céloldalát, ha élő demót szeretne látni. Ez jól működik a böngészőben, ahol lehet húzza át a szkennelt képeket a szöveg automatikus OCR-fordításához.

A példát a GitHub oldalról is letöltheti, vagy saját alkalmazást hozhat létre a Tesseract.js parancsfájljának CDN-ből történő hozzáadásával.

A legegyszerűbb kódpélda a következőképpen néz ki myImage közvetlen hivatkozás egy HTML képelemre:

 Tesseract.recognize (myImage) .then (függvény (eredmény) console.log (results));

Akárhogy is, ez a könyvtár annyira hasznos, hogy az OCR-n keresztül mozogjon az interneten. Ez messze nem tökéletes, de az is legjobb erőforrás a webes fejlesztők számára, akik dinamikus oldal-OCR-funkciókat akarnak.

További információért látogasson el a Tesseract.js GitHub oldalra, ahol megtekintheti az élő bemutatót, és böngészhet az online dokumentációban.