Sujet : Re: espaces, retours chariot, tab?
De : schaefer (at) *nospam* alphanet.ch (Marc SCHAEFER)
Groupes : fr.comp.lang.regexpDate : 08. Sep 2022, 08:06:06
Autres entêtes
Organisation : Posted through news.alphanet.ch
Message-ID : <tfc0od$aac$1@shakotay.alphanet.ch>
References : 1 2
User-Agent : tin/2.4.3-20181224 ("Glen Mhor") (UNIX) (Linux/4.19.0-21-amd64 (x86_64))
Olivier Miakinen <om+
news@miakinen.net> wrote:
Une possibilité est bien sûr de mettre dans une classe de caractères
tous les caractères blancs que tu veux, par exemple [ \t\r\n].
Et il ne faut pas oublier que certains langages, comme Perl, peuvent
traiter les chaînes de caractères sous forme ligne ou multiligne (cf les
modificateurs /m ou /s documentés dans man perlre, sous Modifiers).
POSIX définit aussi -- et c'est supporté en Perl -- des classes
comme [:space:], voir man perlrecharclass).
Et la plupart du temps, les outils de Perl sont disponibles -- au moins
en partie -- dans la bibliothèque PCRE utilisée par de nombreux
langages.
Sinon, il existe aussi la séquence spéciale \s, mais attention celle-ci
dépendra de la locale utilisée.
Ah, la locale, oui ça peut bien compliquer les choses. Peut-être même
commencer par fixer une normalisation (NFC) p.ex.