Différences
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédente | ||
ocropus [Le 17/05/2009, 22:46] – Sorbus | ocropus [Le 23/06/2020, 18:31] (Version actuelle) – [Utilisation] 185.220.101.130 | ||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
+ | {{tag> | ||
+ | |||
+ | ---- | ||
+ | |||
+ | ====== OCRopy : pour une ROC avec prise en compte de la mise en page ====== | ||
+ | |||
+ | **OCRopy**, autrefois **OCRopus** est en passe de devenir un outil performant de reconnaissance optique de caractères (ROC/OCR), utilisant notamment le moteur de ROC Tesseract, et capable d' | ||
+ | |||
+ | =====Pré-requis===== | ||
+ | * Disposer des [[: | ||
+ | * Disposer d'une connexion à Internet configurée et activée. | ||
+ | * Avoir [[: | ||
+ | |||
+ | =====Installation===== | ||
+ | Pour installer Ocropy entrez successivement ces commandes dans un [[: | ||
+ | cd ocropy/ | ||
+ | git init . | ||
+ | git pull https:// | ||
+ | sudo apt-get install $(cat PACKAGES) | ||
+ | wget -nd http:// | ||
+ | mv en-default.pyrnn.gz models/ | ||
+ | sudo python setup.py install | ||
+ | </ | ||
+ | ====Utilisation==== | ||
+ | Pour tester si cela fontionne, lancez la commande (toujours dans le dossier **ocropy** : | ||
+ | Pour utiliser ocropy, lancez successivement les commandes suivantes (en remplaçant test/ | ||
+ | # perform binarization | ||
+ | ./ | ||
+ | |||
+ | # perform page layout analysis | ||
+ | ./ | ||
+ | |||
+ | |||
+ | Si ça ne fonctionne pas essayer avec : | ||
+ | <code bash> | ||
+ | ./ | ||
+ | </ | ||
+ | Continuez avec (en adaptant le modèle à votre langue) : | ||
+ | <code bash> | ||
+ | # perform text line recognition (on four cores, with a fraktur model) | ||
+ | ./ | ||
+ | # generate HTML output | ||
+ | ./ | ||
+ | |||
+ | # display the output | ||
+ | firefox ersch.html | ||
+ | </ | ||
+ | |||
+ | ===== Modèles ===== | ||
+ | Comme indiqué [[https:// | ||
+ | https:// | ||
+ | |||
+ | ===== Désinstallation ===== | ||
+ | Supprimez le dossier téléchargé avec git (ocropy). | ||
+ | |||
+ | |||
+ | ===== Références ===== | ||
+ | |||
+ | * [[http:// | ||
+ | * [[https:// | ||
+ | * [[tesseract-ocr]], | ||
+ | * [[:XSane]], | ||
+ | * [[http:// | ||
+ | * [[http:// | ||
+ | |||
+ | ------ | ||
+ | |||
+ | //Page réalisée par : [[utilisateurs: | ||
+ | |||