Différences

Ci-dessous, les différences entre deux révisions de la page.

--- ocr [Le 12/07/2017, 16:34] – [kooka] L'Africain
+++ ocr [Le 16/10/2020, 09:57] (Version actuelle) – [LIOS] L'Africain
@@ Ligne 1: / Ligne 1: @@
+{{tag>bureautique portail}}
+----
+====== Reconnaissance optique de caractères (ROC) ======
+La [[wpfr>reconnaissance optique de caractères]] (ROC), ou encore appelé vidéo-codage (traitement postal, chèque bancaire) désigne les procédés informatiques pour la traduction d'images de textes imprimés ou dactylographiés en fichiers de texte.
+Il existe plusieurs logiciels sous GNU/Linux spécialement dédiés, et il est aussi possible d'employer les logiciels existants sous Windows via Wine.
+Voici un petit guide des différentes solutions possibles avec leurs avantages, leurs inconvénients et des liens pour vous en servir.
+Voir également :
+   * Les solutions de [[:ged|Gestion Électronique des Documents (GED)]]
+===== Logiciels d'OCR pour GNU/Linux (utilisables en ligne de commande) =====
+====Cuneiform ====
+[[http://cognitiveforms.com/ru/products_and_services/Cuneiform.html#1189-Cuneiform|cuneiform]] (en russe, ou en [[http://en.cognitiveforms.ru/products/cuneiform/|anglais]]) est un OCR multi-plateforme, qui supporte 20 langues, dont le français. Pour les textes en français et les images propres et lisibles, il donne des résultats très satisfaisants avec une marge d'erreur entre 2 et 3 %. De plus, il semble être le seul à supporter (de façon basique) la mise en forme du texte. Ainsi, il reconnaît les textes soulignés, gras, en italique, et les images. Le texte qu'il ne réussit pas à traiter est également importé sous forme d'image. Il supporte les fichiers images en bmp, jpg, png, tiff,  Il peut exporter en format texte, html, rtf, et d'autres.
+Le projet est en attente de nouveaux développeurs depuis mai 2011 (([[https://code.launchpad.net/cuneiform-linux|Stepping down as maintainer]])). Il dispose toujours d'une [[https://launchpad.net/cuneiform-linux|page Launchpad]] qui héberge le code et est maintenue.
+Voir la  [[http://wiki.ubuntuusers.de/Cuneiform-Linux?highlight=cuneiform#Einbindung-in-XSane|documentation]] en allemand où on trouve un fichier de commande pour xsane du genre de celui de tesseract.
+Pour l'utiliser [[:tutoriel:comment_installer_un_paquet|installez le paquet]] **[[apt>cuneiform]]**.
+Il est aussi possible de lancer cuneiform sur un fichier image par l'intermédiaire d'un [[:nautilus_scripts|script nautilus]] tel que celui-ci :
+<file bash>#!/bin/sh
+printf %s "$NAUTILUS_SCRIPT_SELECTED_FILE_PATHS" |
+while read -r arg
+do
+	convert -colorspace GRAY $arg tmp.tiff
+	cuneiform -l fra -f rtf -o $arg.rtf tmp.tiff
+	rm tmp.tiff
+done</file>
+Il peut être utilisé dans l'interface graphique [[:XSane]].
+==== OCRopus ====
+ [[OCRopus]] (page détaillée) : ROC avec prise en compte de la mise en page (en développement). Très utile pour les vieux manuscrits.
+==== Tesseract-ocr ====
+Voir la page [[:tesseract-ocr]] pour plus d'informations sur l'installation et l'utilisation.\\
+Pour l'utiliser [[:tutoriel:comment_installer_un_paquet|installer le paquet]] **[[apt>tesseract-ocr]]**.\\
+Donne de très bons résultats si l'image est bonne, bons dans tous les cas. Ce qu'il peut faire :
+  * Accepte beaucoup de format d'images (Utilise Leptonica) ;
+  * Gère plusieurs langues dont le français (avec les accents) ;
+  * Possibilité de lui apprendre un nouveau jeu de caractères dans sa dernière version ;
+  * Gestion de plusieurs jeux de caractères simultanés ;
+  * Peut être utilisé dans les interfaces graphiques [[:XSane]] (via les adaptateurs [[:xsane2tess]] ou ocube) et [[:gscan2pdf]].
+==== Gocr ====
+Logiciel qui donne des résultats de qualité médiocre, entre 7 et 8 % d'erreur par document.
+Installez le paquet **[[apt>gocr]]** et **[[apt>gocr-tk]]** pour avoir une interface graphique. Ce qu'il sait faire :
+  * Reconnaît les fichiers png ;
+  * Aide correcte.
+[[http://jocr.sourceforge.net/|Site officiel]]
+==== Ocrad ====
+[[http://www.gnu.org/software/ocrad/ocrad.html|Ocrad]] est un élément du projet GNU. Son développement semble arrêté (ou très ralenti) depuis 2011.\\
+Pour l'utiliser [[:tutoriel:comment_installer_un_paquet|installer le paquet]] **[[apt>ocrad]]**.
+Cependant, les résultat sont médiocres par rapport aux autres moteurs. Peut s'utiliser en ligne de commande ou avec [[:Skanlite]] et [[#OCRFeeder]].
+===== Interfaces graphiques =====
+==== Xsane ====
+[[:Xsane]] (page détaillée) est une application graphique très complète pour scanner, qui utilise **gocr**, **tesseract** ou **cuneiform**.\\
+Pour utiliser la ROC il faudra avoir [[:tutoriel:comment_installer_un_paquet|installé l'un des paquets]] **[[apt>gocr]]** ou **[[apt>cuneiform]]** ou bien le moteur [[:tesseract-ocr]] avec XSane, dont les indications se trouvent sur la page [[:xsane2tess]].
+Pour faire de la ROC avec Xsane il faut :
+  * Choisir son moteur d'OCR : ouvrir Xsane et dans //Préférence -> Configuration -> OCR// il faut, dans la commande OCR, remplacer **gocr** par :
+      * pour  **gocr** avec la reconnaissance des caractères accentués <code>gocr -f UTF8</code>
+      * pour **tesseract** <code >xsane2tess -l fra</code>
+      * pour **cuneiform** <code >cuneiform -l fra</code>
+  * dans la zone à droite de la cible, sélectionner //Enregistrer// ;
+  * dans //Type//, sélectionner //TEXT// ;
+  * dans le sélecteur couleur ou N/B, sélectionner //Gris// ou //Noir/Blanc ou Trait// (à tester selon le document à scanner), et en-dessous, sélectionner la résolution qui convient (pour obtenir les meilleurs résultats, les avis divergent entre 300 et 600 dpi.
+{{ Xsane_roc.png?350 }}
+Ensuite :
+  - dans la fenêtre //Aperçu//, cliquer sur //Acquisition de l'aperçu// ;
+  - recadrer sur la zone de texte à scanner ;
+  - XSane va enregistrer le résultat dans un fichier texte, par défaut sur votre bureau ou dans votre **Dossier personnel** (selon les versions de Xsane). Il est possible de choisir le dossier d'enregistrement du fichier texte en indiquant le chemin dans la zone de saisie située à côté de l'icône "disquette". On peut aussi nommer le fichier. Par exemple en remplaçant **out.txt** par **/home/votre_identité/essai_ocr_1.txt** ;
+  - cliquer sur "Numériser" et attendre le "transfert de l'image" ;
+  - copier-coller le contenu du fichier texte dans un fichier ouvert avec un [[:libreoffice|traitement de texte]] ;
+  - terminer le traitement "à la main" en utilisant le correcteur orthographique du logiciel de traitement de texte.
+cuneiform est le moteur (voir plus haut), paramétré sous Xsane qui a donné les meilleurs résultats, reconnaissance optique presque parfaite, avec une détection excellente des colonnes.
+==== gscan2pdf ====
+Interface graphique permettant notamment de réaliser de la Reconnaissance Optique de Caractères avec les moteurs **gocr** et **tesseract**. Son développement dynamique lui permet d'intégrer les outils les plus performants sous GNU/Linux, dont bientôt **OCRopus**.
+Voir chapitre utilisation de la page détaillée [[:gscan2pdf]].
+==== OCRFeeder ====
+OCRFeeder est une interface graphique simple, permettant de choisir entre plusieurs moteurs : par défaut installe **tesseract**, fonctionne aussi avec **gocr**, **ocrad** et **cuneiform**.
+Attention, le paquet tesseract est installé pour la reconnaissance de l'anglais uniquement. Voir les paquet langues supplémentaires sur [[:tesseract-ocr]].
+<note important>OCRFeeder, après installation, ne se lance pas. Pour résoudre ce problème, entrez la commande suivante dans un [[terminal]] : <code bash>sudo sed -i 's/ocrfeeder -i %f/ocrfeeder/' /usr/share/applications/ocrfeeder.desktop</code></note>
+Traite les images, les fichiers PDF et les sorties de scanner. On peut ajouter le contenu d'un dossier (plusieurs fichiers à la fois).
+[[:tutoriel:comment_installer_un_paquet|Installez le paquet]] ** [[apt>ocrfeeder]]**.\\
+Ce qu'il sait faire :
+  * Sélectionner les zones à traiter,
+  * Voir côte à côte l'image traitée et le résultat,
+  * Détecte automatiquement les colonnes et les images,
+  * Dispose d'un filtre de bruit et de gris paramétrable (unpaper, non testé),
+  * Supprime les sauts de ligne (option),
+  * Export en différents formats, en essayant de conserver la mise en page : ODT, PDF, HTML et texte brut.
+Ce qu'il ne sait pas faire :
+   * La rotation de l'image obtenue via le scanner (gênant quand on scanne un livre au format A5 où deux pages = A4 paysage => il faut faire deux scans au lieu d'un)
+==== Skanlite ====
+Voir la page dédiée : [[:skanlite]].
+==== xsane2tess ====
+[[xsane2tess]]: un adaptateur tesseract pour XSane.
+==== gImageReader ====
+[[gimagereader|gImageReader]] est une interface graphique très simple d'emploi pour **[[:tesseract-ocr|tesseract-ocr]]**.\\
+==== YAGF ====
+[[YAGF]] est une interface graphique pour [[#cuneiform|cuneiform]] (donc une bonne capacité de reconnaissance comme indiqué plus haut) et [[#tesseract|tesseract]].
+**(en)** [[https://sourceforge.net/projects/yagf-ocr/|Site officiel du logiciel]]
+==== LIOS ====
+Lios est une interface graphique pour [[#cuneiform]] et [[#tesseract]]. Pour l'utiliser [[:tutoriel:comment_installer_un_paquet|installez le paquet]] **[[apt>lios]]**. Si vous souhaitez avoir la dernière version en français :
+  * [[:PPA|Ajouter le PPA]] **ppa:nalin-x-linux/lios**((https://launchpad.net/~nalin-x-linux/+archive/ubuntu/lios)) dans vos sources de logiciels;
+  * puis [[:tutoriel:comment_modifier_sources_maj#recharger_la_liste_des_paquets|rechargez la liste des paquets]],
+  * puis installez le paquet **[[apt>lios]]**.
+=====OCR en ligne=====
+Voir les solutions de [[:ged|Gestion Électronique des Documents (GED)]]
+====WatchOCR - Server PDF et OCR du contenu====
+  * [[http://douglaswhitaker.com/2013/10/working-with-pdf-files-efficiently-watchocr//|WatchOCR]] : logiciel libre pour créer un serveur de PDF, capable de transcrire notamment les images en texte, ou les PDF d'image scanné en texte : le tout indexé et prêt pour la recherche ( ala google ).
+===== Programmes Windows utilisables sous GNU/Linux via Wine =====
+==== SimpleOCR ====
+  * [[http://www.01net.com/telecharger/windows/Multimedia/scanner_ocr/fiches/32246.html|Lien de téléchargement]]
+Non libre mais gratuit. Basé sur WOCAR
+, image non PDF
+==== WebOCR ====
+  * [[http://appdb.winehq.org/appview.php?iAppId=829|Fiche sur Winehq.org]]
+==== Recognita ====
+Racheté par ScanSoft software. Une fiche sans aucun commentaire est néanmoins disponible pour la version 5.Tout retour, ici ou sur WineHQ serait grandement apprécié.
+==== ReadIris ====
+[[http://appdb.winehq.org/objectManager.php?sClass=application&iId=2543|Fiche sur WineHQ.org]]
+==== ABBY FineReader 8.0 OCR ====
+Certaines versions anciennes de FineReader fonctionnent plus ou moins sous Wine.
+===== Reconnaissance de l'écriture manuscrite =====
+==== Cellwriter (GNU/Linux) ====
+[[:cellwriter|CellWriter: Reconnaissance de l'écriture manuscrite]]
+==== Myscript (GNU/Linux et win) ====
+  * [[http://appdb.winehq.org/objectManager.php?sClass=application&iId=7180|Fiche de Myscript Note (reconnaissance écriture) sur WineHQ.org]]
+  * [[http://appdb.winehq.org/objectManager.php?sClass=application&iId=8569|Fiche de Myscript Stylus (logiciel interactif) sur WineHQ.org]] ([[http://www.visionobjects.com/handwriting_recognition/downloadstylus3.htm#Linux|existe pour GNU/Linux]] ), reconnaît l'écriture attachée
+Non libre, [[http://www.visionobjects.com/handwriting_recognition/onlinestore.htm|versions d'évaluation 30 jours]] des logiciels sur le site officiel.
+===== Voir aussi =====
+  * [[http://forum.ubuntu-fr.org/viewtopic.php?id=78804|le fil de discussion du forum à propos de l'OCR]]
+----
+//Contributeurs : [[:utilisateurs:Teolemon|Pierre S.]] et [[:utilisateurs:Sorbus]] --- [[:utilisateurs:L'Africain|L'Africain]] Le 14/07/2017, 21:06.//

Différences

Outils pour utilisateurs

Outils du site

Outils de la page

Divers