Différences
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédente | ||
xsane2tess [Le 16/12/2014, 14:45] – [Désinstallation] ajout paquets de langues cafecho | xsane2tess [Le 14/08/2020, 21:45] (Version actuelle) – [Voir aussi] Lien brisé - remplacé par Internet Archive Bissap | ||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
+ | {{tag> | ||
+ | ---- | ||
+ | |||
+ | ====== xsane2tess : un adaptateur tesseract pour Xsane ====== | ||
+ | |||
+ | **xsane2tess** est un adaptateur permettant d' | ||
+ | |||
+ | ===== Pré-requis ===== | ||
+ | * Disposer des [[: | ||
+ | * Disposer d'une connexion à Internet configurée et activée; | ||
+ | * Avoir installé les paquets: | ||
+ | * **[[: | ||
+ | * **[[: | ||
+ | * et **[[: | ||
+ | |||
+ | ===== Installation ===== | ||
+ | Pour utiliser la reconnaissance optique de caractères [[: | ||
+ | - [[: | ||
+ | # | ||
+ | # | ||
+ | ############################################################################## | ||
+ | # | ||
+ | # | ||
+ | # | ||
+ | # *** tesseract made simple *** | ||
+ | # | ||
+ | # | ||
+ | ############################################################################## | ||
+ | # | ||
+ | # xsane2tess is a TesseractOCR wrapper to be able to use tesseract with xsane | ||
+ | # | ||
+ | # | ||
+ | # | ||
+ | TEMP_DIR=/ | ||
+ | ERRORLOG=" | ||
+ | | ||
+ | if [[ -z " | ||
+ | then | ||
+ | echo " | ||
+ | | ||
+ | xsane2tess converts files to TIF, scans them with TesseractOCR | ||
+ | and outputs the text in a file. | ||
+ | | ||
+ | OPTIONS: | ||
+ | -i < | ||
+ | -o < | ||
+ | -l < | ||
+ | | ||
+ | Progress- & error-messages will be stored in this logfile: | ||
+ | | ||
+ | | ||
+ | xsane2tess depends on | ||
+ | - ImageMagick | ||
+ | - TesseractOCR http:// | ||
+ | | ||
+ | Some coding was stolen from ' | ||
+ | http:// | ||
+ | " | ||
+ | exit | ||
+ | fi | ||
+ | | ||
+ | | ||
+ | # get options... | ||
+ | while getopts ": | ||
+ | do | ||
+ | case $OPTION in | ||
+ | i) # input filename (with path) | ||
+ | FILE_PATH=" | ||
+ | ;; | ||
+ | o ) # output filename | ||
+ | FILE_OUT=" | ||
+ | ;; | ||
+ | l ) # Language-selection | ||
+ | TES_LANG=" | ||
+ | ;; | ||
+ | esac | ||
+ | done | ||
+ | | ||
+ | # redirect STDOUT to FILE_OUT | ||
+ | exec 1>> | ||
+ | | ||
+ | # redirect STDERR to ERRORLOG | ||
+ | exec 2>> | ||
+ | | ||
+ | # strip path from FILE_PATH, use filename only | ||
+ | IN_FILE=${FILE_PATH## | ||
+ | | ||
+ | TIF_FILE=" | ||
+ | TXT_FILE=" | ||
+ | | ||
+ | # converting image into TIFF (ImageMagick) | ||
+ | convert " | ||
+ | | ||
+ | # start OCR (tesseract expands output with *.txt) | ||
+ | tesseract " | ||
+ | | ||
+ | # STDOUT scanned text => FILE_OUT | ||
+ | cat " | ||
+ | | ||
+ | # delete graphic file after use | ||
+ | rm " | ||
+ | | ||
+ | # delete tesseract output | ||
+ | rm " | ||
+ | - [[: | ||
+ | - Depuis un [[: | ||
+ | < | ||
+ | Vous pourrez ensuite consulter le fichier // | ||
+ | |||
+ | ===== Utilisation ===== | ||
+ | |||
+ | - Lancer l' | ||
+ | - Puis dans le menu: Préférences -> Configuration -> Onglet " | ||
+ | * **Commande OCR** : xsane2tess -l fra | ||
+ | * **Option de fichier d' | ||
+ | * **Option de fichier de sortie** : -o | ||
+ | |||
+ | La langue du texte à numériser peut être modifiée quand on le veut dans le menu de configuration de XSane [[: | ||
+ | [[:XSane]] présente le grand avantage de permettre la sélection des colonnes ou zones d'un texte l'une après l' | ||
+ | |||
+ | On obtient de bons résultats en numérisant à 300 ppi, noir et blanc (fichier | ||
+ | Pour plus de précisions, | ||
+ | |||
+ | Il suffit ensuite de copier-coller les fichiers obtenus dans une application de traitement de texte comme LibreOffice Writer, et la reconnaissance orthographique fait le reste... | ||
+ | |||
+ | =====Désinstallation==== | ||
+ | Pour supprimer cette application, | ||
+ | Selon la méthode choisie, la configuration globale des applications sont conservées ou supprimées. Les journaux du système, et les fichiers de préférence des utilisateurs dans leurs dossiers personnels sont toujours conservés. | ||
+ | |||
+ | ===== Voir aussi ===== | ||
+ | |||
+ | * [[https:// | ||
+ | * [[: | ||
+ | * [[:Xsane]] (fr) | ||
+ | * [[http:// | ||
+ | * [[http:// | ||
+ | |||
+ | ------ | ||
+ | |||
+ | // |