| Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédente |
| ocr [Le 12/07/2017, 16:34] – [kooka] L'Africain | ocr [Le 16/10/2020, 09:57] (Version actuelle) – [LIOS] L'Africain |
|---|
| | {{tag>bureautique portail}} |
| |
| | ---- |
| | |
| | ====== Reconnaissance optique de caractères (ROC) ====== |
| | |
| | La [[wpfr>reconnaissance optique de caractères]] (ROC), ou encore appelé vidéo-codage (traitement postal, chèque bancaire) désigne les procédés informatiques pour la traduction d'images de textes imprimés ou dactylographiés en fichiers de texte. |
| | |
| | Il existe plusieurs logiciels sous GNU/Linux spécialement dédiés, et il est aussi possible d'employer les logiciels existants sous Windows via Wine. |
| | |
| | Voici un petit guide des différentes solutions possibles avec leurs avantages, leurs inconvénients et des liens pour vous en servir. |
| | |
| | Voir également : |
| | * Les solutions de [[:ged|Gestion Électronique des Documents (GED)]] |
| | |
| | ===== Logiciels d'OCR pour GNU/Linux (utilisables en ligne de commande) ===== |
| | |
| | ====Cuneiform ==== |
| | |
| | [[http://cognitiveforms.com/ru/products_and_services/Cuneiform.html#1189-Cuneiform|cuneiform]] (en russe, ou en [[http://en.cognitiveforms.ru/products/cuneiform/|anglais]]) est un OCR multi-plateforme, qui supporte 20 langues, dont le français. Pour les textes en français et les images propres et lisibles, il donne des résultats très satisfaisants avec une marge d'erreur entre 2 et 3 %. De plus, il semble être le seul à supporter (de façon basique) la mise en forme du texte. Ainsi, il reconnaît les textes soulignés, gras, en italique, et les images. Le texte qu'il ne réussit pas à traiter est également importé sous forme d'image. Il supporte les fichiers images en bmp, jpg, png, tiff, Il peut exporter en format texte, html, rtf, et d'autres. |
| | |
| | Le projet est en attente de nouveaux développeurs depuis mai 2011 (([[https://code.launchpad.net/cuneiform-linux|Stepping down as maintainer]])). Il dispose toujours d'une [[https://launchpad.net/cuneiform-linux|page Launchpad]] qui héberge le code et est maintenue. |
| | |
| | Voir la [[http://wiki.ubuntuusers.de/Cuneiform-Linux?highlight=cuneiform#Einbindung-in-XSane|documentation]] en allemand où on trouve un fichier de commande pour xsane du genre de celui de tesseract. |
| | |
| | Pour l'utiliser [[:tutoriel:comment_installer_un_paquet|installez le paquet]] **[[apt>cuneiform]]**. |
| | |
| | Il est aussi possible de lancer cuneiform sur un fichier image par l'intermédiaire d'un [[:nautilus_scripts|script nautilus]] tel que celui-ci : |
| | <file bash>#!/bin/sh |
| | |
| | printf %s "$NAUTILUS_SCRIPT_SELECTED_FILE_PATHS" | |
| | while read -r arg |
| | do |
| | convert -colorspace GRAY $arg tmp.tiff |
| | cuneiform -l fra -f rtf -o $arg.rtf tmp.tiff |
| | rm tmp.tiff |
| | done</file> |
| | |
| | Il peut être utilisé dans l'interface graphique [[:XSane]]. |
| | |
| | |
| | ==== OCRopus ==== |
| | |
| | [[OCRopus]] (page détaillée) : ROC avec prise en compte de la mise en page (en développement). Très utile pour les vieux manuscrits. |
| | |
| | ==== Tesseract-ocr ==== |
| | |
| | Voir la page [[:tesseract-ocr]] pour plus d'informations sur l'installation et l'utilisation.\\ |
| | Pour l'utiliser [[:tutoriel:comment_installer_un_paquet|installer le paquet]] **[[apt>tesseract-ocr]]**.\\ |
| | Donne de très bons résultats si l'image est bonne, bons dans tous les cas. Ce qu'il peut faire : |
| | * Accepte beaucoup de format d'images (Utilise Leptonica) ; |
| | * Gère plusieurs langues dont le français (avec les accents) ; |
| | * Possibilité de lui apprendre un nouveau jeu de caractères dans sa dernière version ; |
| | * Gestion de plusieurs jeux de caractères simultanés ; |
| | * Peut être utilisé dans les interfaces graphiques [[:XSane]] (via les adaptateurs [[:xsane2tess]] ou ocube) et [[:gscan2pdf]]. |
| | |
| | ==== Gocr ==== |
| | Logiciel qui donne des résultats de qualité médiocre, entre 7 et 8 % d'erreur par document. |
| | |
| | Installez le paquet **[[apt>gocr]]** et **[[apt>gocr-tk]]** pour avoir une interface graphique. Ce qu'il sait faire : |
| | * Reconnaît les fichiers png ; |
| | * Aide correcte. |
| | |
| | [[http://jocr.sourceforge.net/|Site officiel]] |
| | |
| | |
| | ==== Ocrad ==== |
| | [[http://www.gnu.org/software/ocrad/ocrad.html|Ocrad]] est un élément du projet GNU. Son développement semble arrêté (ou très ralenti) depuis 2011.\\ |
| | Pour l'utiliser [[:tutoriel:comment_installer_un_paquet|installer le paquet]] **[[apt>ocrad]]**. |
| | Cependant, les résultat sont médiocres par rapport aux autres moteurs. Peut s'utiliser en ligne de commande ou avec [[:Skanlite]] et [[#OCRFeeder]]. |
| | |
| | |
| | ===== Interfaces graphiques ===== |
| | |
| | ==== Xsane ==== |
| | [[:Xsane]] (page détaillée) est une application graphique très complète pour scanner, qui utilise **gocr**, **tesseract** ou **cuneiform**.\\ |
| | Pour utiliser la ROC il faudra avoir [[:tutoriel:comment_installer_un_paquet|installé l'un des paquets]] **[[apt>gocr]]** ou **[[apt>cuneiform]]** ou bien le moteur [[:tesseract-ocr]] avec XSane, dont les indications se trouvent sur la page [[:xsane2tess]]. |
| | |
| | Pour faire de la ROC avec Xsane il faut : |
| | * Choisir son moteur d'OCR : ouvrir Xsane et dans //Préférence -> Configuration -> OCR// il faut, dans la commande OCR, remplacer **gocr** par : |
| | * pour **gocr** avec la reconnaissance des caractères accentués <code>gocr -f UTF8</code> |
| | * pour **tesseract** <code >xsane2tess -l fra</code> |
| | * pour **cuneiform** <code >cuneiform -l fra</code> |
| | * dans la zone à droite de la cible, sélectionner //Enregistrer// ; |
| | * dans //Type//, sélectionner //TEXT// ; |
| | * dans le sélecteur couleur ou N/B, sélectionner //Gris// ou //Noir/Blanc ou Trait// (à tester selon le document à scanner), et en-dessous, sélectionner la résolution qui convient (pour obtenir les meilleurs résultats, les avis divergent entre 300 et 600 dpi. |
| | |
| | {{ Xsane_roc.png?350 }} |
| | |
| | Ensuite : |
| | - dans la fenêtre //Aperçu//, cliquer sur //Acquisition de l'aperçu// ; |
| | - recadrer sur la zone de texte à scanner ; |
| | - XSane va enregistrer le résultat dans un fichier texte, par défaut sur votre bureau ou dans votre **Dossier personnel** (selon les versions de Xsane). Il est possible de choisir le dossier d'enregistrement du fichier texte en indiquant le chemin dans la zone de saisie située à côté de l'icône "disquette". On peut aussi nommer le fichier. Par exemple en remplaçant **out.txt** par **/home/votre_identité/essai_ocr_1.txt** ; |
| | - cliquer sur "Numériser" et attendre le "transfert de l'image" ; |
| | - copier-coller le contenu du fichier texte dans un fichier ouvert avec un [[:libreoffice|traitement de texte]] ; |
| | - terminer le traitement "à la main" en utilisant le correcteur orthographique du logiciel de traitement de texte. |
| | |
| | cuneiform est le moteur (voir plus haut), paramétré sous Xsane qui a donné les meilleurs résultats, reconnaissance optique presque parfaite, avec une détection excellente des colonnes. |
| | |
| | ==== gscan2pdf ==== |
| | |
| | Interface graphique permettant notamment de réaliser de la Reconnaissance Optique de Caractères avec les moteurs **gocr** et **tesseract**. Son développement dynamique lui permet d'intégrer les outils les plus performants sous GNU/Linux, dont bientôt **OCRopus**. |
| | |
| | Voir chapitre utilisation de la page détaillée [[:gscan2pdf]]. |
| | |
| | ==== OCRFeeder ==== |
| | |
| | OCRFeeder est une interface graphique simple, permettant de choisir entre plusieurs moteurs : par défaut installe **tesseract**, fonctionne aussi avec **gocr**, **ocrad** et **cuneiform**. |
| | |
| | Attention, le paquet tesseract est installé pour la reconnaissance de l'anglais uniquement. Voir les paquet langues supplémentaires sur [[:tesseract-ocr]]. |
| | |
| | <note important>OCRFeeder, après installation, ne se lance pas. Pour résoudre ce problème, entrez la commande suivante dans un [[terminal]] : <code bash>sudo sed -i 's/ocrfeeder -i %f/ocrfeeder/' /usr/share/applications/ocrfeeder.desktop</code></note> |
| | |
| | Traite les images, les fichiers PDF et les sorties de scanner. On peut ajouter le contenu d'un dossier (plusieurs fichiers à la fois). |
| | |
| | [[:tutoriel:comment_installer_un_paquet|Installez le paquet]] ** [[apt>ocrfeeder]]**.\\ |
| | Ce qu'il sait faire : |
| | * Sélectionner les zones à traiter, |
| | * Voir côte à côte l'image traitée et le résultat, |
| | * Détecte automatiquement les colonnes et les images, |
| | * Dispose d'un filtre de bruit et de gris paramétrable (unpaper, non testé), |
| | * Supprime les sauts de ligne (option), |
| | * Export en différents formats, en essayant de conserver la mise en page : ODT, PDF, HTML et texte brut. |
| | |
| | Ce qu'il ne sait pas faire : |
| | * La rotation de l'image obtenue via le scanner (gênant quand on scanne un livre au format A5 où deux pages = A4 paysage => il faut faire deux scans au lieu d'un) |
| | |
| | |
| | |
| | |
| | ==== Skanlite ==== |
| | |
| | Voir la page dédiée : [[:skanlite]]. |
| | ==== xsane2tess ==== |
| | [[xsane2tess]]: un adaptateur tesseract pour XSane. |
| | |
| | ==== gImageReader ==== |
| | [[gimagereader|gImageReader]] est une interface graphique très simple d'emploi pour **[[:tesseract-ocr|tesseract-ocr]]**.\\ |
| | |
| | ==== YAGF ==== |
| | [[YAGF]] est une interface graphique pour [[#cuneiform|cuneiform]] (donc une bonne capacité de reconnaissance comme indiqué plus haut) et [[#tesseract|tesseract]]. |
| | |
| | **(en)** [[https://sourceforge.net/projects/yagf-ocr/|Site officiel du logiciel]] |
| | |
| | |
| | ==== LIOS ==== |
| | Lios est une interface graphique pour [[#cuneiform]] et [[#tesseract]]. Pour l'utiliser [[:tutoriel:comment_installer_un_paquet|installez le paquet]] **[[apt>lios]]**. Si vous souhaitez avoir la dernière version en français : |
| | * [[:PPA|Ajouter le PPA]] **ppa:nalin-x-linux/lios**((https://launchpad.net/~nalin-x-linux/+archive/ubuntu/lios)) dans vos sources de logiciels; |
| | * puis [[:tutoriel:comment_modifier_sources_maj#recharger_la_liste_des_paquets|rechargez la liste des paquets]], |
| | * puis installez le paquet **[[apt>lios]]**. |
| | =====OCR en ligne===== |
| | |
| | Voir les solutions de [[:ged|Gestion Électronique des Documents (GED)]] |
| | |
| | ====WatchOCR - Server PDF et OCR du contenu==== |
| | |
| | * [[http://douglaswhitaker.com/2013/10/working-with-pdf-files-efficiently-watchocr//|WatchOCR]] : logiciel libre pour créer un serveur de PDF, capable de transcrire notamment les images en texte, ou les PDF d'image scanné en texte : le tout indexé et prêt pour la recherche ( ala google ). |
| | |
| | ===== Programmes Windows utilisables sous GNU/Linux via Wine ===== |
| | |
| | ==== SimpleOCR ==== |
| | |
| | * [[http://www.01net.com/telecharger/windows/Multimedia/scanner_ocr/fiches/32246.html|Lien de téléchargement]] |
| | Non libre mais gratuit. Basé sur WOCAR |
| | , image non PDF |
| | |
| | ==== WebOCR ==== |
| | |
| | * [[http://appdb.winehq.org/appview.php?iAppId=829|Fiche sur Winehq.org]] |
| | |
| | ==== Recognita ==== |
| | |
| | Racheté par ScanSoft software. Une fiche sans aucun commentaire est néanmoins disponible pour la version 5.Tout retour, ici ou sur WineHQ serait grandement apprécié. |
| | |
| | ==== ReadIris ==== |
| | |
| | [[http://appdb.winehq.org/objectManager.php?sClass=application&iId=2543|Fiche sur WineHQ.org]] |
| | |
| | ==== ABBY FineReader 8.0 OCR ==== |
| | |
| | Certaines versions anciennes de FineReader fonctionnent plus ou moins sous Wine. |
| | |
| | ===== Reconnaissance de l'écriture manuscrite ===== |
| | ==== Cellwriter (GNU/Linux) ==== |
| | |
| | [[:cellwriter|CellWriter: Reconnaissance de l'écriture manuscrite]] |
| | |
| | |
| | ==== Myscript (GNU/Linux et win) ==== |
| | * [[http://appdb.winehq.org/objectManager.php?sClass=application&iId=7180|Fiche de Myscript Note (reconnaissance écriture) sur WineHQ.org]] |
| | * [[http://appdb.winehq.org/objectManager.php?sClass=application&iId=8569|Fiche de Myscript Stylus (logiciel interactif) sur WineHQ.org]] ([[http://www.visionobjects.com/handwriting_recognition/downloadstylus3.htm#Linux|existe pour GNU/Linux]] ), reconnaît l'écriture attachée |
| | Non libre, [[http://www.visionobjects.com/handwriting_recognition/onlinestore.htm|versions d'évaluation 30 jours]] des logiciels sur le site officiel. |
| | |
| | ===== Voir aussi ===== |
| | |
| | * [[http://forum.ubuntu-fr.org/viewtopic.php?id=78804|le fil de discussion du forum à propos de l'OCR]] |
| | |
| | ---- |
| | |
| | //Contributeurs : [[:utilisateurs:Teolemon|Pierre S.]] et [[:utilisateurs:Sorbus]] --- [[:utilisateurs:L'Africain|L'Africain]] Le 14/07/2017, 21:06.// |