Les balises dans d’autres langues que l’anglais

Question

Puis-je écrire des éléments HTML et XML et leur attribuer des balises dans des langues ou des alphabets autres que l’anglais ?

Réponse

Les balises HTML ou XHTML sont toutes prédéfinies (en anglais) et doivent le rester afin d’être reconnues par les agents utilisateurs (par exemple les navigateurs).

En XML il est possible de définir vos propres noms de balise. Vous pouvez le faire dans n’importe quelle langue et n’importe quel alphabet supporté par Unicode.

Même si tous les processeurs XML doivent supporter Unicode, il est préférable de procéder avec précaution. Travailler avec une balise en chinois, en arabe ou en hindi peut se révéler difficile si on ne parle pas ces langues ou si on ne dispose pas des bonnes polices ou du bon logiciel de rendu. Les balises en anglais présentent un avantage pour les DTD utilisés par les groupes internationaux parce que la plupart des utilisateurs de tous les pays du monde sont normalement en mesure de les visionner et de les comprendre sans trop de difficultés.

Par ailleurs, les balises non anglaises peuvent être très utiles pour tout ce qui a trait à l’éducation. C’est très commun dans les primers XLM japonais.

En passant

N’oubliez pas que les NCR ne sont pas autorisés dans les balises, et qu’en conséquence, pour utiliser des balises non ASCII, il faut bénéficier d’un encodage qui supporte les caractères nécessaires. Un encodage Unicode du type UTF-8 est généralement la meilleure option.

Si vous utilisez XML 1.1, à peu près tous les caractères sont autorisés, mais pas forcément tous recommandables. Pour savoir lesquels utiliser, consultez l’Annexe B des spécifications pour XML 1.1.

Pour plus d’informations sur les caractères autorisés dans les balises XML, consultez la liste ci-dessous.