Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédente |
ocr [Le 02/09/2018, 21:09] – [LIOS] L'Africain | ocr [Le 16/10/2020, 09:57] (Version actuelle) – [LIOS] L'Africain |
---|
| {{tag>bureautique portail}} |
| |
| ---- |
| |
| ====== Reconnaissance optique de caractères (ROC) ====== |
| |
| La [[wpfr>reconnaissance optique de caractères]] (ROC), ou encore appelé vidéo-codage (traitement postal, chèque bancaire) désigne les procédés informatiques pour la traduction d'images de textes imprimés ou dactylographiés en fichiers de texte. |
| |
| Il existe plusieurs logiciels sous GNU/Linux spécialement dédiés, et il est aussi possible d'employer les logiciels existants sous Windows via Wine. |
| |
| Voici un petit guide des différentes solutions possibles avec leurs avantages, leurs inconvénients et des liens pour vous en servir. |
| |
| Voir également : |
| * Les solutions de [[:ged|Gestion Électronique des Documents (GED)]] |
| |
| ===== Logiciels d'OCR pour GNU/Linux (utilisables en ligne de commande) ===== |
| |
| ====Cuneiform ==== |
| |
| [[http://cognitiveforms.com/ru/products_and_services/Cuneiform.html#1189-Cuneiform|cuneiform]] (en russe, ou en [[http://en.cognitiveforms.ru/products/cuneiform/|anglais]]) est un OCR multi-plateforme, qui supporte 20 langues, dont le français. Pour les textes en français et les images propres et lisibles, il donne des résultats très satisfaisants avec une marge d'erreur entre 2 et 3 %. De plus, il semble être le seul à supporter (de façon basique) la mise en forme du texte. Ainsi, il reconnaît les textes soulignés, gras, en italique, et les images. Le texte qu'il ne réussit pas à traiter est également importé sous forme d'image. Il supporte les fichiers images en bmp, jpg, png, tiff, Il peut exporter en format texte, html, rtf, et d'autres. |
| |
| Le projet est en attente de nouveaux développeurs depuis mai 2011 (([[https://code.launchpad.net/cuneiform-linux|Stepping down as maintainer]])). Il dispose toujours d'une [[https://launchpad.net/cuneiform-linux|page Launchpad]] qui héberge le code et est maintenue. |
| |
| Voir la [[http://wiki.ubuntuusers.de/Cuneiform-Linux?highlight=cuneiform#Einbindung-in-XSane|documentation]] en allemand où on trouve un fichier de commande pour xsane du genre de celui de tesseract. |
| |
| Pour l'utiliser [[:tutoriel:comment_installer_un_paquet|installez le paquet]] **[[apt>cuneiform]]**. |
| |
| Il est aussi possible de lancer cuneiform sur un fichier image par l'intermédiaire d'un [[:nautilus_scripts|script nautilus]] tel que celui-ci : |
| <file bash>#!/bin/sh |
| |
| printf %s "$NAUTILUS_SCRIPT_SELECTED_FILE_PATHS" | |
| while read -r arg |
| do |
| convert -colorspace GRAY $arg tmp.tiff |
| cuneiform -l fra -f rtf -o $arg.rtf tmp.tiff |
| rm tmp.tiff |
| done</file> |
| |
| Il peut être utilisé dans l'interface graphique [[:XSane]]. |
| |
| |
| ==== OCRopus ==== |
| |
| [[OCRopus]] (page détaillée) : ROC avec prise en compte de la mise en page (en développement). Très utile pour les vieux manuscrits. |
| |
| ==== Tesseract-ocr ==== |
| |
| Voir la page [[:tesseract-ocr]] pour plus d'informations sur l'installation et l'utilisation.\\ |
| Pour l'utiliser [[:tutoriel:comment_installer_un_paquet|installer le paquet]] **[[apt>tesseract-ocr]]**.\\ |
| Donne de très bons résultats si l'image est bonne, bons dans tous les cas. Ce qu'il peut faire : |
| * Accepte beaucoup de format d'images (Utilise Leptonica) ; |
| * Gère plusieurs langues dont le français (avec les accents) ; |
| * Possibilité de lui apprendre un nouveau jeu de caractères dans sa dernière version ; |
| * Gestion de plusieurs jeux de caractères simultanés ; |
| * Peut être utilisé dans les interfaces graphiques [[:XSane]] (via les adaptateurs [[:xsane2tess]] ou ocube) et [[:gscan2pdf]]. |
| |
| ==== Gocr ==== |
| Logiciel qui donne des résultats de qualité médiocre, entre 7 et 8 % d'erreur par document. |
| |
| Installez le paquet **[[apt>gocr]]** et **[[apt>gocr-tk]]** pour avoir une interface graphique. Ce qu'il sait faire : |
| * Reconnaît les fichiers png ; |
| * Aide correcte. |
| |
| [[http://jocr.sourceforge.net/|Site officiel]] |
| |
| |
| ==== Ocrad ==== |
| [[http://www.gnu.org/software/ocrad/ocrad.html|Ocrad]] est un élément du projet GNU. Son développement semble arrêté (ou très ralenti) depuis 2011.\\ |
| Pour l'utiliser [[:tutoriel:comment_installer_un_paquet|installer le paquet]] **[[apt>ocrad]]**. |
| Cependant, les résultat sont médiocres par rapport aux autres moteurs. Peut s'utiliser en ligne de commande ou avec [[:Skanlite]] et [[#OCRFeeder]]. |
| |
| |
| ===== Interfaces graphiques ===== |
| |
| ==== Xsane ==== |
| [[:Xsane]] (page détaillée) est une application graphique très complète pour scanner, qui utilise **gocr**, **tesseract** ou **cuneiform**.\\ |
| Pour utiliser la ROC il faudra avoir [[:tutoriel:comment_installer_un_paquet|installé l'un des paquets]] **[[apt>gocr]]** ou **[[apt>cuneiform]]** ou bien le moteur [[:tesseract-ocr]] avec XSane, dont les indications se trouvent sur la page [[:xsane2tess]]. |
| |
| Pour faire de la ROC avec Xsane il faut : |
| * Choisir son moteur d'OCR : ouvrir Xsane et dans //Préférence -> Configuration -> OCR// il faut, dans la commande OCR, remplacer **gocr** par : |
| * pour **gocr** avec la reconnaissance des caractères accentués <code>gocr -f UTF8</code> |
| * pour **tesseract** <code >xsane2tess -l fra</code> |
| * pour **cuneiform** <code >cuneiform -l fra</code> |
| * dans la zone à droite de la cible, sélectionner //Enregistrer// ; |
| * dans //Type//, sélectionner //TEXT// ; |
| * dans le sélecteur couleur ou N/B, sélectionner //Gris// ou //Noir/Blanc ou Trait// (à tester selon le document à scanner), et en-dessous, sélectionner la résolution qui convient (pour obtenir les meilleurs résultats, les avis divergent entre 300 et 600 dpi. |
| |
| {{ Xsane_roc.png?350 }} |
| |
| Ensuite : |
| - dans la fenêtre //Aperçu//, cliquer sur //Acquisition de l'aperçu// ; |
| - recadrer sur la zone de texte à scanner ; |
| - XSane va enregistrer le résultat dans un fichier texte, par défaut sur votre bureau ou dans votre **Dossier personnel** (selon les versions de Xsane). Il est possible de choisir le dossier d'enregistrement du fichier texte en indiquant le chemin dans la zone de saisie située à côté de l'icône "disquette". On peut aussi nommer le fichier. Par exemple en remplaçant **out.txt** par **/home/votre_identité/essai_ocr_1.txt** ; |
| - cliquer sur "Numériser" et attendre le "transfert de l'image" ; |
| - copier-coller le contenu du fichier texte dans un fichier ouvert avec un [[:libreoffice|traitement de texte]] ; |
| - terminer le traitement "à la main" en utilisant le correcteur orthographique du logiciel de traitement de texte. |
| |
| cuneiform est le moteur (voir plus haut), paramétré sous Xsane qui a donné les meilleurs résultats, reconnaissance optique presque parfaite, avec une détection excellente des colonnes. |
| |
| ==== gscan2pdf ==== |
| |
| Interface graphique permettant notamment de réaliser de la Reconnaissance Optique de Caractères avec les moteurs **gocr** et **tesseract**. Son développement dynamique lui permet d'intégrer les outils les plus performants sous GNU/Linux, dont bientôt **OCRopus**. |
| |
| Voir chapitre utilisation de la page détaillée [[:gscan2pdf]]. |
| |
| ==== OCRFeeder ==== |
| |
| OCRFeeder est une interface graphique simple, permettant de choisir entre plusieurs moteurs : par défaut installe **tesseract**, fonctionne aussi avec **gocr**, **ocrad** et **cuneiform**. |
| |
| Attention, le paquet tesseract est installé pour la reconnaissance de l'anglais uniquement. Voir les paquet langues supplémentaires sur [[:tesseract-ocr]]. |
| |
| <note important>OCRFeeder, après installation, ne se lance pas. Pour résoudre ce problème, entrez la commande suivante dans un [[terminal]] : <code bash>sudo sed -i 's/ocrfeeder -i %f/ocrfeeder/' /usr/share/applications/ocrfeeder.desktop</code></note> |
| |
| Traite les images, les fichiers PDF et les sorties de scanner. On peut ajouter le contenu d'un dossier (plusieurs fichiers à la fois). |
| |
| [[:tutoriel:comment_installer_un_paquet|Installez le paquet]] ** [[apt>ocrfeeder]]**.\\ |
| Ce qu'il sait faire : |
| * Sélectionner les zones à traiter, |
| * Voir côte à côte l'image traitée et le résultat, |
| * Détecte automatiquement les colonnes et les images, |
| * Dispose d'un filtre de bruit et de gris paramétrable (unpaper, non testé), |
| * Supprime les sauts de ligne (option), |
| * Export en différents formats, en essayant de conserver la mise en page : ODT, PDF, HTML et texte brut. |
| |
| Ce qu'il ne sait pas faire : |
| * La rotation de l'image obtenue via le scanner (gênant quand on scanne un livre au format A5 où deux pages = A4 paysage => il faut faire deux scans au lieu d'un) |
| |
| |
| |
| |
| ==== Skanlite ==== |
| |
| Voir la page dédiée : [[:skanlite]]. |
| ==== xsane2tess ==== |
| [[xsane2tess]]: un adaptateur tesseract pour XSane. |
| |
| ==== gImageReader ==== |
| [[gimagereader|gImageReader]] est une interface graphique très simple d'emploi pour **[[:tesseract-ocr|tesseract-ocr]]**.\\ |
| |
| ==== YAGF ==== |
| [[YAGF]] est une interface graphique pour [[#cuneiform|cuneiform]] (donc une bonne capacité de reconnaissance comme indiqué plus haut) et [[#tesseract|tesseract]]. |
| |
| **(en)** [[https://sourceforge.net/projects/yagf-ocr/|Site officiel du logiciel]] |
| |
| |
| ==== LIOS ==== |
| Lios est une interface graphique pour [[#cuneiform]] et [[#tesseract]]. Pour l'utiliser [[:tutoriel:comment_installer_un_paquet|installez le paquet]] **[[apt>lios]]**. Si vous souhaitez avoir la dernière version en français : |
| * [[:PPA|Ajouter le PPA]] **ppa:nalin-x-linux/lios**((https://launchpad.net/~nalin-x-linux/+archive/ubuntu/lios)) dans vos sources de logiciels; |
| * puis [[:tutoriel:comment_modifier_sources_maj#recharger_la_liste_des_paquets|rechargez la liste des paquets]], |
| * puis installez le paquet **[[apt>lios]]**. |
| =====OCR en ligne===== |
| |
| Voir les solutions de [[:ged|Gestion Électronique des Documents (GED)]] |
| |
| ====WatchOCR - Server PDF et OCR du contenu==== |
| |
| * [[http://douglaswhitaker.com/2013/10/working-with-pdf-files-efficiently-watchocr//|WatchOCR]] : logiciel libre pour créer un serveur de PDF, capable de transcrire notamment les images en texte, ou les PDF d'image scanné en texte : le tout indexé et prêt pour la recherche ( ala google ). |
| |
| ===== Programmes Windows utilisables sous GNU/Linux via Wine ===== |
| |
| ==== SimpleOCR ==== |
| |
| * [[http://www.01net.com/telecharger/windows/Multimedia/scanner_ocr/fiches/32246.html|Lien de téléchargement]] |
| Non libre mais gratuit. Basé sur WOCAR |
| , image non PDF |
| |
| ==== WebOCR ==== |
| |
| * [[http://appdb.winehq.org/appview.php?iAppId=829|Fiche sur Winehq.org]] |
| |
| ==== Recognita ==== |
| |
| Racheté par ScanSoft software. Une fiche sans aucun commentaire est néanmoins disponible pour la version 5.Tout retour, ici ou sur WineHQ serait grandement apprécié. |
| |
| ==== ReadIris ==== |
| |
| [[http://appdb.winehq.org/objectManager.php?sClass=application&iId=2543|Fiche sur WineHQ.org]] |
| |
| ==== ABBY FineReader 8.0 OCR ==== |
| |
| Certaines versions anciennes de FineReader fonctionnent plus ou moins sous Wine. |
| |
| ===== Reconnaissance de l'écriture manuscrite ===== |
| ==== Cellwriter (GNU/Linux) ==== |
| |
| [[:cellwriter|CellWriter: Reconnaissance de l'écriture manuscrite]] |
| |
| |
| ==== Myscript (GNU/Linux et win) ==== |
| * [[http://appdb.winehq.org/objectManager.php?sClass=application&iId=7180|Fiche de Myscript Note (reconnaissance écriture) sur WineHQ.org]] |
| * [[http://appdb.winehq.org/objectManager.php?sClass=application&iId=8569|Fiche de Myscript Stylus (logiciel interactif) sur WineHQ.org]] ([[http://www.visionobjects.com/handwriting_recognition/downloadstylus3.htm#Linux|existe pour GNU/Linux]] ), reconnaît l'écriture attachée |
| Non libre, [[http://www.visionobjects.com/handwriting_recognition/onlinestore.htm|versions d'évaluation 30 jours]] des logiciels sur le site officiel. |
| |
| ===== Voir aussi ===== |
| |
| * [[http://forum.ubuntu-fr.org/viewtopic.php?id=78804|le fil de discussion du forum à propos de l'OCR]] |
| |
| ---- |
| |
| //Contributeurs : [[:utilisateurs:Teolemon|Pierre S.]] et [[:utilisateurs:Sorbus]] --- [[:utilisateurs:L'Africain|L'Africain]] Le 14/07/2017, 21:06.// |