Sujet : Caractère parasite dans une cellule de tableur.
De : zzz (at) *nospam* aol.com.invalid (Dominique)
Groupes : fr.comp.lang.pythonDate : 14. Aug 2021, 07:56:19
Autres entêtes
Organisation : Aioe.org NNTP Server
Message-ID : <sf7lu3$1c7m$1@gioia.aioe.org>
User-Agent : Mozilla/5.0 (X11; Linux x86_64; rv:91.0) Gecko/20100101 Thunderbird/91.0
Bonjour,
Je retraite de gros fichiers csv avec Pandas (pour supprimer des colonnes et des lignes inutiles) et Python (bibliothèque csv)
Vous trouverez ici :
https://drop.sans-nuage.fr/r/Lcj9I9_12h#xbtPIzJd6zt2Cu0JNojli+VBpCJxNHJ0B+E7legRgOE=un fichier csv avec deux champs séparés par un ;
Le second champ est pollué par un retour à la ligne (\b). Avec gedit, ce second champ apparaît sur une 2e ligne ligne !
Je sais le traiter sans problème avec LibreOffice. Mais je ne vois pas comment supprimer ce \b avec Python (idéalement avec Pandas). Le bout de fichier que je vous passe fait partie d'un fichier de plusieurs milliers de lignes.
Je souhaite automatiser au maximum le retraitement afin de ne pas conduire des utilisateurs peu agiles avec LibreOffice à faire des manipulations compliquées, notamment retirer ce \b invisible.
Je vous remercie,
-- DominiqueCourriel : dominique point sextant ate orange en FranceEsto quod es