71
Tesseract.js to biblioteka javascript, która pobiera słowa w prawie każdym języku z obrazów.Silnik Tesseract OCR był jednym z 3 najlepszych silników w teście dokładności UNLV 1995.W latach 1995–2006 wykonano niewiele pracy, ale jest to prawdopodobnie jeden z najdokładniejszych dostępnych silników OCR dostępnych na rynku.Kod źródłowy odczytuje obraz binarny, szary lub kolorowy i tekst wyjściowy.Wbudowany jest czytnik tiff, który odczytuje nieskompresowane obrazy TIFF, lub libtiff można dodać do odczytu skompresowanych obrazów.Istnieją pliki językowe dla wielu języków, nawet dla tekstu ustawionego we czcionkach Fraktur i blackletter ...