lundi 30 janvier 2006

Les IDN : arnaque ou opportunité ?

Les IDN : arnaque ou opportunité ?

Tout d’abord, de quoi parle-t-on ? C’est quoi les IDN ?

Un puriste exigeant (pléonasme ?) me dirait qu’IDN est un acronyme, et qu’en bon français le sigle serait NDI.
Peut-être. Mais en puriste moi-même, je rétorquerais qu’un sigle francisé doit traduire une implantation terminologique adoptée, au moins par consensus à défaut de l’être par l’usage.
Or dans le cas des IDN, on n’a ni l’un ni l’autre. Si vous êtes chercheurs d'OR, saisissez dans votre outil de recherche préféré NDI + noms de domaine internationalisés, ou NDI + noms de domaine internationaux, et dans un cas comme dans l’autre vous trouverez quelques résultats ici et là, autant d’OVNI (occurrences variées non identifiées) qu’on peut compter sur les doigts de la main.
Noms de domaine accentués semble plus utilisé, mais l’acception est incorrecte : outre les caractères accentués, les IDN prennent en compte les signes diacritiques, les idéogrammes, etc.
Donc, je préfère garder le sigle anglais et parler de noms de domaine multilingues ou internationalisés, voire localisés. Voilà pour la partie terminologique.

* * *

Ça fait longtemps que je m’intéresse aux IDN, très exactement depuis le jour où j’ai découvert leur existence. J’ai alors cherché sur l’Internet francophone tout ce que je pouvais trouver sur la question, et j’ai vite dû déchanter : informations aussi négatives que dépassées, aucune analyse pertinente, tout au plus des anecdotes et une exploitation des angoisses de l’internaute lambda devant les risques du phishing, du spoofing et autres gentillesses, on dirait que les IDN suscitent la psychose collective ! En France du moins.
Mais il faudrait bien que l’on comprenne, dans notre cher pays, que la problématique des domaines multilingues dépasse largement le cadre de nos frontières, tant linguistiques que physiques. Les autres cultures ont d’ailleurs appréhendé la question dans toute sa mesure, des allemands aux chinois, des espagnols aux japonais, des russes aux coréens, etc., qui représentent des centaines de millions d'utilisateurs concernés par les IDN,

au même titre que les français, ceux-ci restant les seuls à faire de la résistance, comme Papy, comme toujours !
Or il suffirait d'examiner un instant notre taux de pénétration sur le Web pour comprendre qu’Astérix a vécu, et que l’exception culturelle à tort et à travers et a contrario, ça ne débouche sur rien d’autre que du vide.

L’Afnic, qui aimerait bien se présenter sous un beau jour en nous parlant de l’évolution des noms enregistrés sous .fr, soit 434.777 domaines au jour où j'écris ce billet (en prenant en compte tous les domaines et sous-domaines enregistrés, juste pour grossir un peu le chiffre…), nous montre une belle courbe :

Pourtant ils devraient aussi préciser que ça ne représente pas même 1% (et encore, en étant larges, disons qu’on est plus proches de 0,5% que de 1%) des quelque 63 millions de domaines actifs (chiffre qui ne comptabilise certainement pas les sous-domaines !).


Quant au taux de pénétration du nombre d’internautes par rapport à la population, nous ne sommes pas même dans la liste des 30 premiers pays !

Si là est l'évolution...

* * *

Passons maintenant au côté pratique.
Le seul centre d'enregistrement français agréé par l'ICANN pour enregistrer les IDN est Gandi. Or essayez d'aller y enregistrer un domaine multilingue, vous verrez que c'est pas gagné d'avance !

Et pourtant, ça va bientôt faire 3 ans que la première version des lignes directrices pour le déploiement des IDN a été approuvée, avant d'être publiée le 20 juin 2003. Pour information, voici une version traduite du projet de rédaction de la version 2.0, datée septembre 2005.

Donc, concrètement, en plus des caractères alphanumériques ASCII (A-Z, 0-9) et du tiret (-), qui sont pris en charge par le système actuel de nommage sur Internet (DNS - Domain Name System), nous avons essentiellement 14 caractères accentués pour le français (avec entre parenthèses la valeur hexadécimale ISO 646) :
  1. le a accent grave : à (00E0)
  2. le a accent circonflexe : â (00E2)
  3. le c cédille : ç (00E7)
  4. le e accent grave : è (00E8)
  5. le e accent aigu : é (00E9)
  6. le e accent circonflexe : ê (00EA)
  7. le e tréma : ë (00EB)
  8. le i accent circonflexe : î (00EE)
  9. le i tréma : ï (00EF)
  10. le o accent circonflexe : ô (00F4)
  11. le u accent grave : ù (00F9)
  12. le u accent circonflexe : û (00FB)
  13. le u tréma : ü (00FC)
  14. la ligature oe : œ (0153)
Maintenant, pour traduire un simple nom accentué en nom acceptable par le DNS, pas besoin de faire de savants calculs, il suffit de prendre un outil de conversion comme il y en a de nombreux sur Internet. Exemple avec Linéaires.com :

La conversion du nom s’effectue en 5 étapes :
  • Selon le protocole Nameprep (chargé de réduire les caractères au format Unicode à une forme canonique, cf. RFC 3491), la valeur Unicode (U+valeur hexadécimale ISO 646) du L majuscule (U+004C) est d’abord convertie en l minuscule (U+006C)
  • Une fois l’opération Nameprep terminée, on a la valeur Unicode du domaine, soit, dans le cas de linéaires, U+006C U+0069 U+006E U+00E9 U+0061 U+0069 U+0072 U+0065 U+0073 :
Copyright (c) Studio 92 Snc - 2006
  • Le nom en version Unicode est alors converti par le protocole Punycode : xn--linaires-d1a.com
  • Puis le nom ainsi codé en chaîne ACE (encodage compatible ASCII) est enregistré dans le système de nommage Internet (DNS – Domain Name System), qui peut désormais l’interpréter
  • Enfin, le nom de domaine est enregistré dans le Whois sous ses deux versions : xn--linaires-d1a.com + linéaires.com
Il ne vous reste plus qu’à développer un beau site (ou, encore mieux, un portail) pour exploiter à plein régime l’énorme potentiel du nom de domaine www.linéaires.com...


P.S. à votre avis, entre ces deux versions, www.lineaires.com et www.linéaires.com, quelle est celle qui aura la préférence de l’internaute francophone ?

, , ,