vendredi 16 avril 2010
Vous êtes familier avec le caractère � ? Les mots dans votre page web s'affichent comme ceci "développement", avec des ?, des ou encore des carrés remplacent certains caractères ? C'est que vous avez un problème d'encodage ou de jeu de caractères.
Souvent, c'est parce que le charset n'est pas spécifié correctement dans la page. Assurez-vous autant que possible d'utiliser l'encodage UTF-8 et de placer ce meta tag (doit être le premier pour être certain que l'interpréteur en tienne compte) :
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />Je vous recommande aussi d'enregistrer vos fichiers sources dans le même encodage.
Mais ASCII, ANSI, ISO-8859-1, ANSII, Unicode, UTF-8, UCS-2... Comment décortiquer le tout ?
Je vous donne une piste de solution en vous renvoyant à un article intéressant qu'on peut trouver sur le blogue de Joel Spolsky et que j'ai relu cette semaine : The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!). Une traduction française est aussi disponible.
Ce site est également très complet
http://davidmasclet.gisgraphy.com/category/Encoding, il explique ce qu'est l'encoding et le deuxième article parle plus particulièrement de java.