Homepage » Web Design » Tesseract.js A kép OCR fordítása a böngészőkhöz

    Tesseract.js A kép OCR fordítása a böngészőkhöz

    Az OCR fordítás még mindig nem tökéletes, de az elmúlt években jelentősen javult. Az út vezetője a Tesseract fordítómotor jelenleg nyitva van C++.

    Habár ez hihetetlen könyvtár, ez azonban csak szoftverekre korlátozódik. Szerencsére valaki Tesseract portot adott a JavaScript-be, amelyet Tesseract.js néven hívnak. Azt legfeljebb 60 nyelvet támogat és bár ez biztosan nem tökéletes, jól működik.

    A telepítés és a beállítás egyszerű, ahol lehet bármilyen képelemet céloz az oldalon, és futtassa a Tesseract.recognize () funkció. Ez bármilyen típusú képet hozhat, és automatikusan fog megjelenni tömöríteni és lefordítani közvetlenül a böngészőben.

    Sokkal bonyolultabb, de a szépség hogyan lehet futtatni az OCR-t egyetlen kódsorral.

    Nézze meg a Tesseract.js céloldalát, ha élő demót szeretne látni. Ez jól működik a böngészőben, ahol lehet húzza át a szkennelt képeket a szöveg automatikus OCR-fordításához.

    A példát a GitHub oldalról is letöltheti, vagy saját alkalmazást hozhat létre a Tesseract.js parancsfájljának CDN-ből történő hozzáadásával.

    A legegyszerűbb kódpélda a következőképpen néz ki myImage közvetlen hivatkozás egy HTML képelemre:

     Tesseract.recognize (myImage) .then (függvény (eredmény) console.log (results)); 

    Akárhogy is, ez a könyvtár annyira hasznos, hogy az OCR-n keresztül mozogjon az interneten. Ez messze nem tökéletes, de az is legjobb erőforrás a webes fejlesztők számára, akik dinamikus oldal-OCR-funkciókat akarnak.

    További információért látogasson el a Tesseract.js GitHub oldalra, ahol megtekintheti az élő bemutatót, és böngészhet az online dokumentációban.