Sujet : Re: Encodage UTF8 Vs. UTF-8
De : om+news (at) *nospam* miakinen.net (Olivier Miakinen)
Groupes : fr.comp.usenet.lecteurs-de-newsDate : 03. Nov 2023, 17:55:08
Autres entêtes
Organisation : There's no cabale
Message-ID : <ui38ld$1pfo$1@cabale.usenet-fr.net>
References : 1 2 3 4 5 6 7 8
User-Agent : Mozilla/5.0 (X11; Linux x86_64; rv:52.0) Gecko/20100101 Firefox/52.0 SeaMonkey/2.49.4
[Note : je recommence la lecture de usenet après 2 semaines d'absence, il
est possible que ce que je vais écrire ait déjà été répondu]
Le 21/10/2023 14:45, M.V. a écrit :
Mais si tu avais eu :
>
Subject: =?UTF8?B?W1LDiVNVTFRBVF1bw4lDSEVDXSBDcsOpYXRpb24gZGUgZnIu?=
=?UTF8?B?c2NpLnBoeXNpcXVlLnJlbGF0aXZpdGU=?=
>
je doute qu'il se soit affiché correctement !
Mais je n'en suis plus si sûr : MacCafé le décode parfaitement et le
décodeur universel que j'avais fabriqué avec l'aide d'Olivier il y a
quelques années le décode correctement également… Surprenant.
Je pense avoir l'explication.
D'une part, le nom officiel est "UTF-8" et le seul alias reconnu par l'IANA
serait "csUTF8" :
<
https://www.iana.org/assignments/character-sets/character-sets.xhtml>
§
...
UTF-8 106 [RFC3629] [RFC3629] csUTF8
...
§
Mais d'autre part, si tu utilises la commande iconv pour le décodage,
celle-ci semble plus souple dans les noms qu'elle accepte :
$ iconv -l
...
ISO-10646, ISO-10646/UCS2, ISO-10646/UCS4, *ISO-10646/UTF-8*, *ISO-10646/UTF8*,
...
UCS-4LE, UCS2, UCS4, UHC, UJIS, UK, UNICODE, UNICODEBIG, UNICODELITTLE,
US-ASCII, US, UTF-7, *UTF-8*, UTF-16, UTF-16BE, UTF-16LE, UTF-32, UTF-32BE,
UTF-32LE, UTF7, *UTF8*, UTF16, UTF16BE, UTF16LE, UTF32, UTF32BE, UTF32LE,
...
-- Olivier Miakinen