MacQuébec

Readiris Pro – Quand ça « ROC » !

Read Iris Pro - Illustration

La Reconnaissance Optique de Caractères (ROC) désigne les procédés informatiques utilisés pour la traduction d’images et de textes imprimés ou dactylographiés en fichiers texte. Elle est certes beaucoup moins efficace que l’être humain qui exécute, en plus de la reconnaissance, la compréhension du message, sa mémorisation, voire son analyse critique dans un seul temps mais elle permet d’éviter un travail de saisie qui peut être long et fastidieux. Pour l’exécution de cette tâche, un ordinateur réclame un un logiciel de reconnaissance optique de caractères, ROC ou OCR (acronyme du terme anglais Optical Character Recognition), qui permet de récupérer le texte d’un document imprimé et de le sauvegarder dans un fichier modifiable dans un traitement de texte pour enrichissement et de le stocker dans une base de données ou sur un support sûr et exploitable par un système informatique.

Ce procédé, inventé dans les années 1950, est encore relativement méconnu (vous trouverez un bref historique en fin d’article). Ce type de logiciel est multilingue car il doit par exemple être capable de reconnaître les accents d’une langue à l’autre.

Une des premières entreprises a avoir proposé des logiciels d’OCR pour le grand public est Omnipage, qui depuis a été rachetée par Nuance Software (éditeur de Dragon Speech Recognition qui est à la base de Siri sur iOS). Depuis ce rachat, Omnipage n’est plus disponible sur Mac.

Readiris Pro  est une autre application simple d’OCR, indispensable pour qui veut sauver temps et argent. Il permet de numériser directement à partir du pilote de votre appareil qui est reconnu par le logiciel ou encore d’importer un fichier image déjà enregistré dans votre ordinateur.

Si un simple numériseur à 75 $ fait très bien l’affaire, un modèle plus coûteux permettra par exemple de « feeder » plusieurs feuilles (50) sans intervention humaine.

La reconnaissance est efficace à condition d’avoir un document de bonne qualité. Dans le cas contraire, il est possible de créer un fichier de reconnaissance : le logiciel numérise une partie du document et nous soumet ce qu’il croit interpréter. C’est ensuite à nous de lui indiquer les corrections éventuelles, comme par exemple « nn » qui aurait été reconnu comme la lettre « m ». D’autres options classiques pour ce genre de logiciel sont également disponibles comme la reconnaissance de texte en tableau, en colonnes, journaux, chiffrier Excel, etc.

Read Iris Pro - Interface

L’application s’achète chez un fournisseur de produit informatique ou de façon moins coûteuse directement sur le site de Readiris qui est une entreprise des Pays-Bas.

Readiris – le site…

À votre tour d’essayer !

_______________________________________________________________________________

BRÈVE HISTOIRE DE LA ROC

En 1950, Frank Rowlett, qui avait cassé le code diplomatique japonais PURPLE, demanda à David Shepard, un cryptanalyste de l’AFSA (prédécesseur de la NSA), de travailler avec Louis Tordella pour faire à l’agence des propositions de procédures d’automatisation des données. La question incluait le problème de la conversion de messages imprimés en langage machine pour le traitement informatique. Shepard décida qu’il devait être possible de construire une machine pour le faire, et, avec l’aide de Harvey Cook, un ami, construisit « Gismo » dans son grenier pendant ses soirées et ses week-ends. Le fait fut rapporté dans le Washington Daily News du 27 avril 1951 et dans le New York Times du 26 décembre 1953 après le dépôt du brevet numéro 2663758. Shepard fonda alors Intelligent Machines Research Corporation (IMR), qui livra les premiers systèmes de ROC au monde exploités par des sociétés privées. Le premier système privé fut installé au Reader’s Digest en 1955, et, de nombreuses années plus tard, fut offert par le Readers Digest au Smithsonian, où il fut mis en exposition. Les autres systèmes vendus par IMR à la fin des années 1950 comprenaient un lecteur de bordereaux de facturation à l’Ohio Bell Company et un numériseur (scanner de documents) à l’US Air Force pour la lecture et la transmission par télex de messages dactylographiés. IBM et d’autres utilisèrent plus tard les brevets de Shepard.

Depuis 1965, la Poste des États-Unis utilise pour trier le courrier des machines ROC dont le principe de fonctionnement a été imaginé par Jacob Rabinow, un inventeur prolifique. Depuis 1971, la Poste canadienne utilise des systèmes ROC qui lisent le nom et l’adresse du destinataire au premier centre de tri automatisé et impriment sur l’enveloppe un code-barres basé sur le code postal. Les lettres n’ont plus qu’à être triées dans les centres suivants par des trieuses moins coûteuses qui n’ont qu’à lire le code-barres. Pour éviter toute interférence avec l’adresse lisible qui peut se trouver n’importe où sur la lettre, une encre spéciale est utilisée, qui est clairement visible sous une lumière UV. Cette encre semble orange dans des conditions d’éclairage normales. (source Wikipedia et recherches personnelles)

À propos de l'auteur

Tayaout-Nicolas

Tayaout-Nicolas

… est formateur agréé par la CPMT depuis 1998. Il dirige Tn formation depuis 1992, ceci lui permet d'enseigner pour de prestigieuses entreprises d'ici et d'ailleurs : Sid Lee, Cirque du Soleil, Cossette, Palm Arnold, Vidéotron, Ville de Montréal, etc. Il transmet sa passion et ses connaissances par des ateliers, des conférences et des formations liées à la photographie, au design graphique et à la vidéographie.

Recevez quotidiennement les dernières nouvelles de l’univers Apple

Inscrivez-vous dès maintenant pour avoir accès aux dernières nouvelles et à des promotions exclusives!

Commentaires