Sujet : Re: Mise en Route de la Super Configuration Linux de Ghost "Michu" Raider
De : ghost-raider (at) *nospam* compuserve.com (Ghost-Raider)
Groupes : fr.comp.os.linux.configurationDate : 05. May 2022, 19:23:26
Autres entêtes
Organisation : A noiseless patient Spider
Message-ID : <t5116e$j1d$1@dont-email.me>
References : 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27
User-Agent : Mozilla/5.0 (X11; Linux x86_64; rv:91.0) Gecko/20100101 Thunderbird/91.8.1
Le 05/05/2022 à 15:49, Jacques L'helgoualc'h a écrit :
Le 05-05-2022, Ghost-Raider a écrit :
[ Banques + PDF = :/ ]
Ce que je crains le plus, ce sont les *.pdf-images, où tu auras besoin d'OCR.
J'ai tout numérisé en PDF indexés.
Sinon, il y a les convertisseurs pdf2qqch ou pdftoqqch ...
Oui, celui-ci est le seul que j'ai trouvé qui crée des zones numériques exploitables :
www.ilovepdf.com/pdf_to_excel
Mais j'ai des milliers de PDF à retranscrire, ça m'étonnerais que je puisse les traiter tous sans passer à la caisse:
"Les fonctionnalités gratuites comprennent :
Accès aux outils iLovePDF
Traitement de documents limité
Travailler sur le web"
Il me faudrait un logiciel en local, éventuellement payant d'ailleurs.
Donc, si quelqu'un connaît la perle rare qui sait repérer et créer
les zones monétaires dans les PDF éventuellement convertis en TXT ou XLS
ou autre, je suis preneur.
Le language *Perl* est ce qu'il te faut pour triturer les textes ---
mais tu devras t'intéresser aux expressions régulières :)
Oui, je viens de regarder mais je n'ai trouvé aucun module Perl qui ressemble même de loin à ce que je recherche.
-- Envoyé depuis mon PC Linux Mint 20.3 Cinnamon 5.2.7