Adresse Web

Pour les articles homonymes, voir Adresse.

Les adresses Web sont l'une des trois inventions[1] Ă  la base du World Wide Web, et selon ses inventeurs[2], la plus fondamentale[3]. Le grand public les connaĂ®t sous la forme de libellĂ©s d'une dizaine de caractères, commençant souvent par « www Â»[4], et qui identifient une page web ; par exemple www.example.com[5]. L'adresse techniquement correcte doit en fait commencer par un nom de protocole ; pour cet exemple, cela donne http://www.example.com. Les adresses web sont la base des hyperliens du Web.

Dans le langage technique, on ne parle pas d'adresse web mais d'URI (pour Uniform Resource Identifier, soit identifiant uniforme de ressource), d'URL (pour Uniform Resource Locator, soit repère uniforme de ressource, un type d'URI), ou plus rarement d'URN (Uniform Resource Name, soit nom uniforme de ressource, un autre type d'URI). Il s'agit de trois standards d'Internet qui spĂ©cifient la syntaxe et la sĂ©mantique des adresses Web, notamment les RFC 1738, RFC 2396 et RFC 3986. En outre, le U de « uniforme Â», qui signifiait Ă  l'origine universel (RFC 1630), met l'accent sur les capacitĂ©s d'adressage quasiment universel de ces adresses : forums Usenet, boĂ®te de courrier Ă©lectronique, fichiers sur site FTP, etc. ; soit pratiquement tout ce qui est disponible sur Internet et mĂŞme au-delĂ , comme des documents de rĂ©fĂ©rence, des livres, etc.

Il ne faut pas confondre les adresses web avec les adresses électroniques ni les adresses IP. La dénomination adresse Internet peut désigner une adresse web, mais elle est en fait totalement ambiguë.

Sommaire

[modifier] Une invention fondamentale

Les trois inventions Ă  la base du World Wide Web sont :

Bien qu'un protocole (HTTP) et un format de données (HTML) ont été développés spécifiquement pour le Web, le web est conçu pour imposer un minimum de contraintes techniques.[3] En particulier, d'autres formats et protocoles que HTTP et HTML peuvent être utilisés. Cependant, pour qu'une ressource puisse faire partie du Web, elle doit être exprimable sous la forme d'une adresse web. C'est en ce sens que les adresses sont l'invention la plus fondamentale.

Soit par exemple un document HTML enregistrĂ© dans un fichier informatique nommĂ© page.html qui se trouve dans le rĂ©pertoire /home/tim/ d'un ordinateur appelĂ© www.example.com. Selon le moyen utilisĂ© pour y accĂ©der, cette ressource peut ĂŞtre connue sous diverses adresses :

file:///home/tim/page.html 
La ressource est accessible en tant que fichier local page.html dans le répertoire /home/tim/. Cette adresse ne fonctionne que sur l'ordinateur où la ressource est enregistrée.
http://www.example.com/tim/page.html 
La ressource est accessible sur le serveur HTTP www.example.com, sous le chemin d'accès /tim/page.html. Le serveur HTTP est configuré pour faire correspondre le chemin d'accès /tim/ au répertoire /home/tim/.
ftp://tim:sEcReT@www.example.com/page.html 
La ressource est accessible en utilisant le protocole FTP (File Transfer Protocol), avec le compte tim et le mot de passe sEcReT, sur le serveur www.example.com. Le serveur FTP est configuré pour donner au compte tim le répertoire /home/tim/.

Plusieurs autres protocoles pourraient ĂŞtre utilisĂ©s pour accĂ©der Ă  cette ressource, pourvu que le serveur idoine ait Ă©tĂ© installĂ© : Gopher, HTTPS, etc. D'autres ressources peuvent ĂŞtre conceptuellement très diffĂ©rentes d'un fichier, par exemple :

mailto:tim@example.com 
La ressource est la destination de courrier électronique d'adresse email tim@example.com.
news:alt.hypertext 
La ressource est le forum de discussion Usenet alt.hypertext.

[modifier] Usages

[modifier] Support des navigateurs web

[modifier] Barre d'adresse

Lorsqu'on navigue sur le Web, le navigateur web affiche dans la barre d'adresse, l'adresse de la ressource consultée. Si l'on veut consulter un document dont on connait l'adresse web, on peut directement la taper dans cette barre.

Dans les premières annĂ©es du Web, les navigateurs web n'acceptaient que des adresses techniquement valides pour identifier les ressources. Mais suite au dĂ©veloppement du Web, le protocole de communication HTTP s'est imposĂ© pour transmettre l'immense majoritĂ© des ressources consultĂ©es. Ainsi une URL de page web commence presque toujours par http://. Les navigateurs web ont donc Ă©voluĂ© pour permettre l'omission de ces caractères lors d'une saisie dans leur barre d'adresse ; http:// est automatiquement ajoutĂ©s le cas Ă©chĂ©ant. Certains navigateurs vont jusqu'Ă  complĂ©ter une adresse comme example en http://www.example.com/, mais le risque de complĂ©tion erronĂ©e n'est alors pas nĂ©gligeable.

[modifier] Vie courante

Des adresses web sont souvent données dans la publicité, ou indiquées sur les produits. Les adresses faciles à retenir sont alors recherchées. Ces adresses sont destinées à être saisies dans la barre d'adresse d'un navigateur, donc le http:// du protocole peut être omis. L'adresse web se résume alors à un simple nom de domaine, comme www.example.com. Ce nom est apparu tellement important dans la communication de certaines entreprises, que durant la bulle Internet, elles ont pris l'adresse de leur site web (Amazon.com, etc.).

D'autre part, une activité économique spécialisée s'est constituée pour acheter les noms de domaine reposant sur des mots courants, susceptibles d'être fréquemment recherchés par des Internautes. Ainsi le domaine sex.com vaut très cher. Légalement plus troubles, le typosquatting consiste à acheter sans autorisation des domaines dont le nom s'apparente à des marques connues appartenant à des tiers. Le cybersquattage consiste carrément à acheter un nom de domaine portant un nom appartenant à une tierce partie, pour le lui revendre chèrement. C'est illégal dans de nombreux pays.

[modifier] Escroquerie de type phishing

L'escroquerie appelée phishing consiste à envoyer à une victime une adresse web qui ressemble à celle d'un site web légitime, comme celui de sa banque, alors qu'en fait il s'agit de l'adresse d'un site conçu pour extorquer des informations confidentiels, comme les codes d'accès au compte bancaire.

[modifier] Syntaxe

La syntaxe de base des adresses web est la suivante :

  • protocole:partie_spĂ©cifique

La syntaxe originale des adresses web reste la plus utilisée. De temps en temps, un nouveau protocole est défini.

[modifier] Jeu de caractères

Originellement, les adresses ne contenaient que des caractères ASCII. Pour pouvoir reprĂ©senter des caractères non ASCII, il existe un système d'Ă©chappement codant en ASCII la valeur hexadĂ©cimale de chaque octet d'un caractère : %HH oĂą HH est un nombre hexadĂ©cimal. Toutefois, ce système d'Ă©chappement n'indique pas quel est le codage de caractères sous-jacent (ISO-8859-1, UTF-8, etc.).

Une extension des URI a Ă©tĂ© créée pour Ă©tendre les adresses web au-delĂ  de l'ASCII : les Internationalized Resource Identifiers (IRI).

[modifier] Syntaxe hiérarchique

De nombreux protocoles (HTTP, FTP) ont une forme d'adresse dite hiérarchique.


http://tim:sEcReT@www.example.com:8888/chemin/acces?req=data#f3ffff
http  :// tim  : sEcReT @ www.example.com  : 8888 /chemin/acces  ? req=data
  1. || ici
protocole  :// nom  : mot de passe @ hĂ´te  : port chemin d'accès  ? requĂŞte
  1. || fragment

Le nom, le mot de passe et le numĂ©ro de port sont rarement utilisĂ©s. Toutefois, les attaques de phishing peuvent tirer parti de cette syntaxe pour masquer un nom de domaine illĂ©gitime sous l'apparence d'un nom lĂ©gitime :

http://ma.banque.fr:8888@illegitime.net/chemin/acces
http  :// ma.banque.fr  : 8888 @ illegitime.net /chemin/acces
protocole  :// nom  : mot de passe @ hĂ´te chemin d'accès

[modifier] Références relatives à une adresse

Avec les adresses web hiĂ©rachique, il est possible de spĂ©cifier une adresse relativement Ă  une autre adresse[6]. La relation s'Ă©tablit au niveau du chemin d'accès. Ainsi, si l'on a :

URI http://tim@sEcReT:www.example.com:8888/chemin/acces?req=data#f3ffff
référence relative toto
URI référencée relativement http://tim@sEcReT:www.example.com:8888/chemin/toto

[modifier] Évolution de la terminologie

Dans les cercles techniques, les adresses web ont Ă©tĂ© connues sous divers noms : adresse WWW, Universal Document Identifier, Universal Resource Identifiers (RFC 1630), et finalement divisĂ©es en Uniform Resource Locators (URL, RFC 1738, RFC 1808) et Uniform Resource Names (URN, RFC 1737), le tout Ă©tant des Uniform Resource Identifiers (URI, RFC 2396, RFC 3986)[7]. L'abrĂ©viation URL est utilisĂ©e dans le standard HTML 3.2[8] est elle est devenue la plus connue et utilisĂ©e par les techniciens. La situation est devenue suffisamment confuse pour que le RFC 3305 soit Ă©crit pour clarifier la terminologie.

Diverses francisations ont Ă©tĂ© proposĂ©es par des organismes nationaux. Le Vocabulaire de l'informatique et de l'internet publiĂ© au Journal officiel du 16 mars 1999 par la Commission gĂ©nĂ©rale de terminologie et de nĂ©ologie de France[9] a proposĂ© « adresse rĂ©ticulaire Â» et « adresse universelle Â». Ces deux dĂ©nominations ont Ă©tĂ© rejetĂ©es par l'Office quĂ©bĂ©cois de la langue française Ă  cause de leur manque de prĂ©cision, et elles ne sont pas entrĂ©es dans l'usage courant. L'Office quĂ©bĂ©cois de la langue française propose[10], « adresse URL Â», « URL Â», « adresse web Â» et « adresse W3 Â». Il fait remarquer que « adresse web Â» ne s'utilise gĂ©nĂ©ralement que pour les ressources des sites web, alors que l'abrĂ©viation URL met l'accent sur l'universalitĂ© de ces adresses, qui peuvent identifier des forums Usenet, des sites FTP, etc. Le grand public confond aussi souvent adresse web, adresse email et adresse IP. Pour Ă©viter toutes ces ambiguĂŻtĂ©s, les professionnels du web utilisent souvent l'abrĂ©viation « URL Â», bien qu'ils fassent en fait rĂ©fĂ©rence aux URI.

Le nom original que l'inventeur du web donne aux adresses web est Universal Document Identifier (UDI) [11]. L'Ă©tĂ© 1992, il propose Ă  l'Internet Engineering Task Force (IETF) de standardiser ces UDI, mais la dĂ©nomination « universel Â» a Ă©tĂ© Ă©cartĂ©e car jugĂ©e trop « arrogante Â» pour un projet alors jeune comme le Web. La dĂ©nomination Uniform Resource Identifier (URI) est le compromis rĂ©sultant.

Lors de la standardisation des URI, il était clair qu'en pratique, les adresses web n'identifiaient pas des documents, mais des emplacements de documents. Autrement dit, si un document est déplacé, alors son adresse change. En pratique, lorsqu'une ressource est déplacée, tous les hyperliens qui y mènent sont brisés, ce qui donne l'erreur HTTP 404 sur un serveur HTTP.

Devant cet Ă©tat de fait, il a Ă©tĂ© dĂ©cidĂ© que les adresses web seraient appelĂ©es Uniform Resource Locator (URL). L'idĂ©e Ă©tait de standardiser deux sortes d'URI : Les URL seraient les URI qui indiquent « comment Â» (par quel chemin sur le rĂ©seau) accĂ©der Ă  une ressource ; les Uniform Resource Names (URN) seraient les URI qui identifient Ă©ternellement les mĂŞmes documents, oĂą qu'ils se trouvent.

Tim Berners-Lee ne cessait cependant pas d'insister pour que, au moins en théorie, les adresses web soient conçues pour être universelles. Il trouvait aussi que l'IETF perdait son temps en discussions, aussi en juin 1994 il publie le RFC 1630, Universal Resource Identifiers in WWW. Ce premier request for comments sur les adresses web est de la catégorie informative. Il décrit simplement la pratique de l'époque, et contient quelques erreurs.

[modifier] Voir aussi

[modifier] Références

  1. ↑ Les trois inventions à la base du World Wide Web sont ses adresses, le Hypertext Markup Language (HTML) et le HyperText Transfer Protocol (HTTP).
  2. ↑ Les inventeurs du World Wide Web sont Tim Berners-Lee et Robert Cailliau.
  3. ↑ a  b  Tim Berners-Lee, Mark Fischetti, Weaving the web the past, present and future of the World Wide Web by its inventor, Londres, Texere, 2000, ISBN 1-58799-018-0, p. 42
  4. ↑ WWW est le sigle du World Wide Web.
  5. ↑ Selon le RFC 2606, le domaine example.com est réservé pour les exemples.
  6. ↑ RFC 3986, chap. 1.2.3
  7. ↑ RFC 1945, chap 3.2
  8. ↑ HTML 3.2 Reference Specification
  9. ↑ Vocabulaire de l'informatique et de l'internet, Journal officiel [français] du 16 mars 1999, [1]
  10. ↑ URL address / adresse URL
  11. ↑ Weaving the Web, p.66

[modifier] Articles connexes

[modifier] Liens externes

  • Vocabulaire d'Internet - Banque de terminologie du QuĂ©bec - [2]
Récupérée de « http://fr.wikipedia.org/wiki/Adresse_Web »

system wymiany linkĂłw wymiana linkami wymiana linkami tanie kredyty gotĂłwkowe kreatyna Plaza 3 star hotel Los Angeles krynica noclegi Sejm Tyk