Les caractères accentués sont souvent sources de problème sur internet. Pour y remédier, les concepteurs de documents HTML recourent à d'obscurs dialectes : "ISO-8859-1", "ISO-8859-15"...

Bien évidemment, les dictionnaires ne connaissent pas ces langages ésotériques. Ce qui contribue certainement à expliquer la quantité épouvantable de fautes qui parsèment encore les pages web ou encore les difficultés que rencontrent les utilisateurs lorsqu'ils effectuent des recherches au travers de documents francophones...

Heureusement, il y a l'UTF-8. Pourquoi encore s'obstiner à devoir remplacer des caractères accentués par des choses comme à, é, è ou & ? Pourquoi garder un pense-bête avec les équivalents HTML de tous les caractères imaginables ?

A priori, l'usage de l'UTF-8 devrait s'imposer un peu partout (et notamment au travers phpStudio). Quelques bémols doivent cependant être apportés :

  • mySQL (toujours par exemple) ne reconnaît officiellement qu'à partir de la version 4.1;
  • il faut s'assurer que les applications (navigateur, moteur de recherche, services web, etc.) savent interpréter correctement l'UTF8;
  • il est parfois nécessaire de rappeler le charset utilisé par les fichiers JavaScript;
  • les données PHP doivent être au format UTF-8.

exemple
<?php
 $access_key = "clé d'accès";
 echo <<<EOT
 <script type="text/javascript">
  //<![CDATA[
   var access_key= "$access_key";
  //-->
  //]]>
 </script>
 <script type="text/javascript" src="script.js" charset="utf-8"></script>
EOT;
?>

Grâce à l'UTF-8, terminé les &eacute; et autres &egrave; ! C'est quand même bien le progrès, non ?



A lire :
Iso-8859-1, iso-8859-15, utf-8, lequel choisir ?
Introduction aux jeux de caractères
Qu'est ce Qu'Unicode?