Sujet : Re: Encodage, charset et type MIME
De : om+news (at) *nospam* miakinen.net (Olivier Miakinen)
Groupes : fr.comp.usenet.lecteurs-de-newsDate : 18. Jan 2024, 11:45:52
Autres entêtes
Organisation : There's no cabale
Message-ID : <uoavh0$c49$1@cabale.usenet-fr.net>
References : 1 2 3
User-Agent : Mozilla/5.0 (X11; Linux x86_64; rv:52.0) Gecko/20100101 Firefox/52.0 SeaMonkey/2.49.4
Le 18/01/2024 10:00, Doug713705 a écrit :
>
Et l'encodage ne touche pas forcément le sujet : ici, dans
<news:uoaopi$rue$1@rasp.pasdenom.info>, c'est le From qui est encodé en
UTF-8 Base64
En effet, en fait, les entêtes "éditables" doivent pouvoir être encodés:
- From
- Subject
- Organization
- Et même Newsgroups, il me semble qu'on avait testé sur mon serveur la
création et la propagation de newsgroups avec des noms en utf-8 avec accents.
D'après le RFC 2047 (qui était prévu pour le courriel et fait donc référence
au RFC 822), un encoded-word peut être utilisé dans ce qui est de type 'text'
comme par exemple les champs Subject: et Comments:, dans ce qui est de type
"phrase" comme par exemple la partie display-name d'un champ From: ou Reply-To:
ou encore le champ Keywords, mais aussi dans tout ce qui est un commentaire
entre parenthèses, donc par exemple dans l'équivalent du display-name pour le
non-regretté MacSOUP.
Le champ Organization n'est pas défini pour le courriel, mais dans le RFC 5536
(dernier RFC sur le format des news¹) il est défini de la même façon que le
champ Subject dans le RFC 5322 (dernier RFC sur le format du mail), donc
c'est bien évidemment autorisé aussi.
En revanche, le format du champ Newsgroups n'autorise absolument pas d'encodage
MIME selon le RFC 2047. La seule possibilité consiste à autoriser des caractères
hors d'US-ASCII, et la seule solution viable est de le faire en UTF-8.
<
https://datatracker.ietf.org/doc/html/rfc5536#section-3.1.4>
newsgroups = "Newsgroups:" SP newsgroup-list CRLF
newsgroup-list = *WSP newsgroup-name
*( [FWS] "," [FWS] newsgroup-name ) *WSP
newsgroup-name = component *( "." component )
component = 1*component-char
component-char = ALPHA / DIGIT / "+" / "-" / "_"
</>
-- Olivier Miakinen¹ En fait non il y a le RFC 6854 mais qui ne le remplace pas.