Sujet : Re: Mauvais encodage
De : om+news (at) *nospam* miakinen.net (Olivier Miakinen)
Groupes : fr.comp.infosystemesDate : 17. Nov 2024, 22:29:53
Autres entêtes
Organisation : There's no cabale
Message-ID : <vhdn8h$2t8t$1@cabale.usenet-fr.net>
References : 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
User-Agent : Mozilla/5.0 (X11; Linux x86_64; rv:52.0) Gecko/20100101 Firefox/52.0 SeaMonkey/2.49.4
Le 17/11/2024 15:52, Jo Engo a écrit :
Et donc, maintenant que tu as su lire, qu'y as-tu découvert ? Est-ce
ISO-8859-1 comme tu le supposais, ou bien windows-1252 comme je l'ai
moi-même découvert ?
windows-1252, mais pourquoi ?
Je l'ai expliqué dans deux de mes trois derniers articles. L'encodage annoncé
n'existe pas, et la présence d'octets isolés tels que E9 prouve que cela ne
peut pas être UTF-8. Alors le navigateur a l'intelligence de se rabattre sur
windows-1252 qui est un sur-ensemble de ISO-8859-1.
Il me semble que http y est pour quelque
chose.
Dans le sens où http envoie une annonce de charset qui n'existe pas, c'est
exact. Mais ce n'est pas http qui dit au navigateur comment cette incohérence
devrait être interprétée. Cf. ci-dessus.
I faudrait essayer wget ou autres outils pour être sûr,
???
wget ne fait aucune interprétation, il se contente de récupérer les octets qui
ont été envoyés, pour les stocker dans un fichier.
mais j'zi
l'intuition sure c'est le serveur http de Yamo qui annonce ça (ça se voit
dans les en-têtes http, pas dans les en-têtes html)
Le serveur http n'envoie aucun autre encodage que celui, erroné, égal
à iso-885925. Et j'avais regardé la page html, il n'y avait aucun
<meta http-equiv="Content-Type" ...>. Http est bien le seul fautif.
$ curl -I http://pasdenom.info/fortune/
HTTP/1.1 200 OK
Date: Sun, 17 Nov 2024 14:49:42 GMT
Server: Apache/2.4.62 (Debian)
Content-Type: text/html; charset=iso-885915
Benon. C'est donc le serveur qui est en cause, pas la page, c'est apache
qui est mal configuré
C'est ce que je dis depuis le début.
et je ne sais toujours pas d'où sort ce windows-1252.
Cf. supra. C'est un choix parmi les plus logiques que fait le navigateur
pour maximiser les chances d'afficher quelque chose de correct malgré un
charset annoncé incorrect.
Tu n'aurais pas une autre page mal configurée sous le coude,
histoire de voir ?
Je pourrais le faire, mais ça me prendrait du temps alors que de mon point
de vue la messe est déjà dite.
-- Olivier Miakinen