Extraire le texte d'un Pdf , d'un site, d'une image ....

II est parfois difficile d'obtenir un texte sur lequel on veut travailler avec Word : copier-coller interdit, document au format image ou PDF... 
Obtenir un texte pour le retravailler ou en utiliser une partie n'est pas si facile que l'on croit. Peut-être avez-vous déjà fait l'expérience des sites qui interdisent l'utilisation du clic droit (pour que l'internaute ne fasse pas de copier-coller) ou des PDF récalcitrants qui ne retranscrivent pas correctement leur texte une fois collé dans Word ? Si votre texte est sur un papier ou un document image (JPG, BMP, TIFF, etc.), vous pensez qu'il faut tout recopier ?
Avec les OCR, ces logiciels qui reconnaissent les caractères, vous pouvez rapatrier l'intégralité d'un écrit sur votre traitement de texte sans problème. Il suffit d'un scanner pour vous retirer cette épine du pied. Enfin, nous avons aussi une astuce pour les malchanceux qui perdraient un texte tapé à l'intérieur d'un formulaire internet (si vous avez déjà utilisé le site du Pôle Emploi, vous savez de quoi nous parlons). En deux clics, vous retrouverez vos écrits et vous éviterez la crise de nerfs...

01  PDF vers Word 
Vous avez sans doute remarqué que copier du texte à partir d'un PDF était parfois bien difficile. Que vous vouliez avoir la même organisation des textes ou juste le texte brut, allez sur www.pdftoword.com/fr et remplissez les champs. Votre fichier Word converti vous sera envoyé à votre adresse mail ! Pour obtenir le texte brut il suffira d'un copier-coller supplémentaire !
02  Image vers Word 
Si vous avez un document papier et que vous voulez mettre son contenu sur votre traitement de texte, il suffit d'utiliser SimpleOCR, un logiciel de reconnaissance de caractère www.simpleocr.com. Il suffit de scanner le document et c'est tout ! Si vous n'avez pas de scanner, SimpleOCR permet de travailler directement sur un fichier TIFF !

03  Copier-coller Interdit ? 
Si un site vous affiche un message vous notifiant que le clic droit est interdit (pour ne pas que vous puissiez faire de copier-coller), il est possible de passer outre ! Dans Firefox, faites Outils>Options>Contenu puis décochez Activer Javascript. Sachez aussi que vous pouvez sélectionner le texte à la souris et faire Ctrl+C au clavier (Ctrl +V pour coller).
04  Ressuscitez un texte ! 
C'est le genre de mésaventure qui arrive à tout le monde : vous tapez un texte dans un formulaire Web et à cause d'un bug ou d'une panne, tout est à refaire ! Si vous avez Firefox, vous pouvez toujours utiliser l'extension Lazarus que vous trouverez à cette adresse : https://addons.mozilla.org/firefox/addon/6984 Une fois revenu à votre formulaire vierge, faites un clic droit puis Recover Form ou Recover Text !

Enregistrer un commentaire

Post a Comment (0)

Plus récente Plus ancienne