Qu'est-ce que le HTML. Histoire de la création. Histoire de la création et du développement du langage HTML

  • Traduction

HTML est le langage qui unit le World Wide Web. Avec juste un ensemble de balises simples, l’humanité a réussi à créer un système incomparable de pages et de sites Web interconnectés : d’Amazon, eBay et Wikipedia, aux blogs personnels et aux sites dédiés aux chats qui ressemblent à Hitler.

HTML5 est la dernière version de ce langage. Mais même si cela apportera des changements importants et de nouvelles opportunités, on ne peut pas dire que cela se produit pour la première fois et que la langue n’a jamais évolué auparavant. Il s'est développé et constamment amélioré, et ce depuis sa création.

Comme World Wide Web En général, HTML - HyperText Markup Language - est une idée originale de Sir Tim Berners-Lee. En 1991, il a écrit un article intitulé « HTML Tags », dans lequel il décrivait un peu moins de deux douzaines de balises qu'il proposait pour baliser les pages Web.

L’idée d’utiliser pour cela des mots de code entre crochets triangulaires n’appartenait cependant pas à Sir Tim. Un tel système existait déjà à cette époque et était utilisé dans SGML (Standard Generalized Markup Language), et au lieu d'inventer quelque chose à partir de zéro, Sir Tim a jugé plus rationnel de le prendre comme base. solutions existantes. Une approche similaire a été utilisée tout au long du processus de développement de HTML5.

De l'IEFT au W3C : le chemin vers HTML 4

Il n'y a jamais eu de version de HTML 1. La première spécification officielle était HTML 2.0, publiée par l'IETF (Internet Engineering Task Force). De nombreuses fonctionnalités du langage décrites dans cette spécification étaient basées sur des développements tiers déjà utilisés. Par exemple, balisez pour insérer des images dans les pages a été implémenté dans le principal navigateur de l'époque (nous parlons de 1994) le navigateur Mosaic, puis a simplement migré vers le standard HTML 2.0.

Le relais de l'IEFT a ensuite été repris par le W3C ( Mondial Web Consortium, World Wide Web Consortium), qui était responsable de toutes les versions ultérieures de HTML. Dans la seconde moitié des années 90, un travail actif a été mené pour réviser et modifier les spécifications, qui ont finalement (plus précisément, en 1999) donné naissance à HTML 4.01.

Après cela, le premier tournant clé est survenu dans l’histoire du HTML.

XHTML 1 : HTML au format XML

La nouvelle version du langage de balisage après HTML 4.01 s'appelle XHTML 1.0. Le « X » dans le nom signifiait eXtreme, et les développeurs Web devaient croiser les bras devant eux à chaque fois qu'ils prononçaient ce mot.

Non bien sûr que non. En fait, le « x » signifiait eXtensible (« extensible »), et croiser les bras était facultatif.

La spécification elle-même pour XHTML 1.0 n'était pas différente de HTML 4.01. Aucune nouvelle balise ou paramètre n'a été ajouté - la seule différence réside dans les règles de syntaxe. Alors qu'en HTML, les développeurs disposaient d'une liberté totale quant au style d'écriture du code, en XHTML, ils étaient tenus de suivre des règles. Langage XML, - beaucoup plus rigide et intolérant aux libertés, - sur lesquelles reposaient la plupart des technologies développées par le Consortium.

Les règles strictes se sont toutefois avérées utiles. Ils ont encouragé les codeurs à s'en tenir style uniforme, par exemple, écrivez toutes les balises et paramètres exclusivement en minuscules, alors qu'en HTML, vous pouvez le faire selon vos besoins.

La sortie de XHTML 1.0 a coïncidé avec un niveau de support accru navigateurs modernes les feuilles de style - CSS - et la syntaxe XHTML stricte ont pris pied dans la communauté des développeurs avec une réputation la meilleure façonécrire du code de balisage.

Puis il y a eu XHTML 1.1.

Si la version 1.0 n'était que du HTML créé sous XML, alors XHTML 1.1 est déjà du vrai XML pur. Dans le sens où il n'était plus possible de lui appliquer le type mime texte/html et devait désigner le document comme étant au format XML. Cependant, dans ce cas, le navigateur le plus populaire de l'époque n'aurait pas pu l'afficher - Internet Explorer, - donc mettre ce langage en pratique n'était clairement pas une option.

Il semblait que le W3C, dans son évolution, commençait à perdre contact avec la réalité dans laquelle vivait le World Wide Web.

XHTML 2 : non, il ne rentre plus dans aucune porte

Si le personnage de Dustin Hoffman dans The Graduate était un web designer, le W3C n'aurait qu'un seul mot à lui dire : XML.

Le consortium était convaincu que HTML était devenu obsolète après la version 4 et a commencé à travailler sur XHTML 2, dont l'objectif était de conduire le Web vers un brillant avenir XML. Et bien que le nom soit resté le même, la nouvelle version n'avait absolument rien à voir avec XHTML 1. De plus, elle n'avait pas vocation à être rétrocompatible avec ses prédécesseurs et les anciennes versions de HTML (et donc avec tous les contenus web existants). Au lieu de cela, il aurait dû introduire un nouveau langage clair, débarrassé de tout vestige des spécifications passées.

En d’autres termes, c’était absurde.

Divisé : W(HATWG) TF ?

Un soulèvement se préparait au sein du Consortium. Il était évident qu'il allait diriger le développement de normes - bien que nouvelles, propres et belles - mais totalement insensibles aux besoins de la communauté moderne des concepteurs et développeurs Web. Opera, Apple et Mozilla n'étaient clairement pas satisfaits de cela, car ils s'attendaient à quelque chose de complètement différent : davantage d'accent sur les formats qui élargissent les possibilités de création d'applications Web.

Le début des changements a eu lieu en 2004 lors d'une des réunions. Ian Hickson, qui était à l'époque employé d'Opera Software, a proposé de développer le HTML à un niveau permettant d'utiliser le langage pour des applications Web. L'offre a été rejetée.

Les rebelles déçus ont été contraints de se séparer du Consortium et de s'organiser propre groupe: Groupe de travail sur la technologie des applications hypertextes Web, en abrégé WHATWG.

Des applications Web 1.0 au HTML5

La façon dont WHATWG fonctionnait était quelque peu différente de celle du W3C. Au W3C, les problèmes sont soulevés, discutés et la décision finale est prise par vote populaire. Dans WHATWG, des problèmes sont également soulevés et discutés, mais les décisions finales concernant ce qui est inclus dans la spécification et ce qui ne l'est pas appartiennent au rédacteur en chef, Ian Hickson.

À première vue, il peut sembler que le système du W3C est plus démocratique et honnête, mais la pratique montre que les conflits sans fin et les querelles internes ralentissent terriblement le processus de développement. Dans WHATWG, où tout le monde peut contribuer, mais où le patron a le dernier mot, les choses avancent beaucoup plus vite. Le rédacteur en chef n'a cependant pas absolu pouvoir - un groupe restreint de hauts fonctionnaires peut contester sa décision dans le cas peu probable où cela l'exigerait.

Initialement, WHATWG se concentrait sur deux spécifications – Web Forms 2.0 et Web Apps 1.0 – qui étaient toutes deux destinées à être des extensions du HTML. Mais au fil du temps, ils ont été combinés en un seul, simplement appelé HTML5.

Réunion

Pendant que le WHATWG travaillait sur HTML5, le W3C continuait à s'occuper de son XHTML 2. Cela ne veut pas dire que l'idée allait être merdique. Elle s'y enfonça lentement et lentement.

En octobre 2006, Sir Tim Berners-Lee admettait sur son blog que l'idée de faire passer le Web du HTML au XML était stupide. Quelques mois plus tard, le W3C publiait nouvelle installation au groupe de travail HTML : il a été sagement décidé que les futures versions de HTML devraient s'appuyer sur le travail du WHATWG, plutôt que de partir de zéro.

Tous ces revirements et changements de cap ont conduit à une situation quelque peu confuse. Pendant un certain temps, le W3C travaillait simultanément sur deux langages de balisage totalement incompatibles - XTHML 2 et HTML 5 (attention, avec un espace) - tandis que le WHATWG, une organisation distincte, travaillait sur la spécification HTML5 (sans espace) cela allait devenir la base d'une autre spécification du W3C. Le raifort poussera ici, quoi de neuf ? Il aurait été plus facile de comprendre la séquence des événements dans Memento et les œuvres de David Lynch.

XHTML est mort, vive la syntaxe XHTML

La situation a commencé à devenir plus claire en 2009, lorsque le W3C a annoncé qu'il n'y aurait plus de mises à jour de XHTML 2. Essentiellement, ils ont simplement admis officiellement que le format était mort depuis sa naissance.

Cependant, d'une manière étrange, au lieu de passer inaperçue, la mort de XHTML 2 a donné lieu à une sorte de bouillonnement malveillant. Les opposants à XML ont transformé cette nouvelle en un appel à l’abandon de XHTML 1, même si, comme nous le savons, cela n’avait rien de commun avec XHTML 2. À leur tour, les partisans de XHTML 1, adeptes d’une syntaxe stricte, craignaient que HTML5 ne légitime une fois de plus une mise en page bâclée.

Ce dernier, cependant, ne devrait pas sembler être un problème sérieux - comme nous le verrons plus tard, chacun a le droit de choisir lui-même le degré de rigueur de la syntaxe HTML5.

Développement HTML5

L’état actuel du HTML5 n’est plus aussi trouble qu’avant, mais il n’est toujours pas très transparent non plus.

Deux organisations travaillent actuellement sur ce format. Le WHATWG développe la spécification sur la base du principe « exécuter d’abord, tester plus tard ». Le groupe de travail HTML du W3C reprend à son tour cette spécification et la soumet à un processus « tester d'abord, puis exécuter ». Comme vous pouvez le constater, une telle coopération peut difficilement être qualifiée de solide et efficace. Mais au moins, la question de « mettre ou non un espace » dans le nom de la norme semble avoir été résolue (il n'est pas nécessaire de le mettre, si c'est le cas - HTML5).

La plus grande préoccupation des concepteurs de sites Web, qui ont déjà essayé certaines des fonctionnalités du nouveau langage, est la question : "Quand sera-t-il prêt ?" Dans une interview, Ian Hickson a mentionné 2022 comme date à laquelle HTML5 recevra le statut de « recommandation proposée ». Cela a provoqué une vague d’indignation parmi les concepteurs, car ils n’avaient aucune idée de ce que signifiait « proposition de recommandation », mais ils savaient avec certitude qu’ils n’avaient clairement pas assez de doigts pour compter combien d’années encore ils devaient attendre jusqu’en 2022.

Si vous y regardez, l’indignation est infondée. Dans ce cas, « recommandation proposée » signifie qu’à ce stade, les navigateurs devraient prendre entièrement en charge toutes les fonctionnalités linguistiques. Dans ce cas, viser 2022 est encore trop audacieux ; nous savons tous que de nombreux navigateurs ont eu du mal à capter même normes existantes. Prenez Internet Explorer, qui a mis plus de dix ans avant même de commencer à prendre en charge la balise. .

Date à laquelle vraiment il faut être conscient que nous sommes en 2012, date à laquelle HTML5 recevra le statut de « recommandation candidate », ce qui signifie que la spécification a été finalisée et, en tant que telle, la norme est prête.

Mais, bien sûr, cela ne signifie pas que tout cela sera immédiatement disponible - vous devrez surveiller la manière dont les navigateurs ajoutent progressivement la prise en charge de certaines fonctionnalités et commencer à les utiliser au fur et à mesure qu'elles apparaissent. En fait, c'était exactement la même chose avec CSS 2.1 : nous avons commencé à tirer parti des capacités de cette norme au fur et à mesure que les navigateurs l'incluaient de manière fragmentaire. Si nous avions préféré attendre qu’ils le mettent en œuvre dans son intégralité, nous attendrions encore.

En d’autres termes, il n’y aura pas un moment où vous pourrez dire « Bang, l’heure du HTML5 est venue ! » Mais vous pouvez commencer à travailler avec eux dès maintenant. Heureusement, cette langue n'est pas née d'une révolution, mais d'un processus d'évolution et est basée sur ce qui a été créé avant elle. Nous pouvons donc dire que si vous utilisez des versions précédentes de HTML, vous utilisez déjà HTML5.

Histoire du développement HTML

En 1989, Tim Berners-Lee propose à la direction centre international projet à haute énergie (CERN) pour un système hypertexte distribué, qu'il a appelé le World Wide Web (WWW). L'idée originale du système était d'utiliser l'hypertexte système de navigation combiner toutes les nombreuses ressources d’information du CERN en un seul système d’information. La technologie s'est avérée si efficace qu'elle a donné une impulsion au développement de l'un des systèmes d'information mondiaux les plus populaires au monde. Presque dans l'esprit de la plupart des utilisateurs du réseau informatique mondial Internet, ce réseau lui-même est associé à trois technologies de l'information principales :

· courrier électronique (e-mail) ;

· déposer Archives FTP;

· World Wide Web.

De plus, les dernières technologies occupent progressivement la première place.

Le succès de la technologie World Wide Web est déterminé par deux facteurs principaux : la simplicité et l'utilisation de la famille de protocoles d'interconnexion TCP/IP (Transmission Control Protocol, Internet Protocol), qui constituent la base d'Internet.

Presque tous les internautes ont eu simultanément l'occasion de s'essayer en tant que créateurs et lecteurs de documents d'information publiés sur le World Wide Web. Mais la popularité d'Internet lui-même est en grande partie due à l'émergence du World Wide Web, puisqu'il s'agit du premier Technologie de réseau, qui a fourni à l'utilisateur un simple interface moderne pour accéder à une variété de ressources réseau. La simplicité et la facilité d'utilisation ont conduit à une augmentation du nombre d'utilisateurs WWW et a attiré l'attention des structures commerciales. Ensuite, le processus de croissance du nombre d'utilisateurs est devenu une avalanche, et cela se poursuit encore aujourd'hui.

Dans le même temps, la technologie elle-même était extrêmement simple au stade initial. Le fait est que lors du développement de divers composants technologiques (langage hypertexte Balisage HTML(HyperText Markup Language, langage de balisage hypertexte), protocole d'échange d'informations hypertextes HTTP, spécifications de développement d'applications logiciel CGI, etc.), il a été supposé que les qualifications des auteurs des ressources informationnelles et de leurs équipements la technologie informatique sera minime.

L'un des composants de la technologie permettant de créer un système hypertexte distribué sur le World Wide Web était le langage de balisage hypertexte HTML, développé par Tim Berners-Lee sur la base du langage de balisage généralisé standard (SGML). Daniel W. Connolly a écrit une définition de type de document à cet effet - une description formelle de la syntaxe HTML en termes SGML.

Les développeurs HTML ont pu résoudre deux problèmes :

· fournir aux concepteurs de bases de données hypertextes un moyen simple de créer des documents ;

· Rendre cet outil suffisamment puissant pour refléter les idées alors existantes sur l'interface utilisateur des bases de données hypertextes.

Le premier problème a été résolu en choisissant un modèle de balisage pour la description du document. Ce modèle est largement utilisé dans les systèmes de préparation de documents pour l'impression. Un exemple d'un tel système serait langue célèbre Balisage de documents scientifiques TeX, proposé par l'American Mathematical Society, et programmes pour son interprétation.

Langage HTML permet de marquer document électronique, qui s'affiche à l'écran avec un niveau de conception d'impression ; le document résultant peut contenir une grande variété d'étiquettes, d'illustrations, de fragments audio et vidéo, etc. Le langage comprend des outils développés pour créer différents niveaux de titres, des sélections de polices, diverses listes, tableaux et bien plus encore.

Le deuxième point important qui a influencé le sort du HTML était qu'un fichier texte ordinaire a été choisi comme base. Le choix a été fait sous l'influence des facteurs suivants :

· un tel fichier peut être créé dans n'importe quel éditeur de texte sur n'importe quelle plate-forme matérielle dans n'importe quel environnement système opérateur;

· au moment du développement, HTML existait Norme américaine pour le développement de systèmes d'information en réseau - Z39.50, dans lequel un simple fichier texte en codage LATIN1 a été spécifié comme unité de stockage, ce qui correspond à US ASCII.

Ainsi, une base de données hypertexte en concept WWW- c'est un ensemble fichiers texte, balisé en langage HTML, qui définit la forme de présentation de l'information (balisage) et la structure des connexions entre ces fichiers et d'autres ressources d'information (liens hypertextes). Des liens hypertextes qui établissent des liens entre documents texte, a progressivement commencé à combiner une variété de ressources d'information, notamment le son et la vidéo ; En conséquence, un nouveau concept est apparu : l'hypermédia.

Cette approche présuppose la présence d'un autre composant de la technologie : un interprète de langage. Sur le World Wide Web, les fonctions d'interprétation sont réparties entre le serveur Web de base de données hypertexte et l'interface utilisateur. Le serveur, en plus d'accéder aux documents et de traiter les liens hypertextes, assure le prétraitement des documents, tandis que l'interface utilisateur interprète les constructions linguistiques liées à la présentation des informations.

La première version du langage (HTML 1.0) visait à présenter le langage en tant que tel, où la description de ses capacités était plutôt de nature consultative. La deuxième version du langage (HTML 2.0) a enregistré la pratique d'utilisation de ses constructions. La version ++ (HTML++) a introduit de nouvelles fonctionnalités, élargissant l'ensemble des balises HTML pour afficher des informations et des tableaux scientifiques, ainsi qu'améliorant le style de mise en page des images et du texte. La version 3.2 a pu rationaliser toutes les innovations et les harmoniser avec les pratiques existantes. HTML 3.2 vous permet d'implémenter l'utilisation de tableaux, l'exécution de code Langage Java, le texte s'enroule autour des graphiques et affiche les exposants et les indices.

Aujourd'hui, le World Wide Web Consortium (W3C) - une organisation internationale qui prépare et distribue de la documentation pour décrire les nouvelles versions de HTML - a déjà publié des documents sur la spécification HTML 4.01. En plus des capacités de balisage de texte, d'inclusion de multimédia et de formation de liens hypertextes qui existaient déjà dans Versions précédentes HTML, version 4.01 comprend des outils supplémentaires pour travailler avec le multimédia, des langages de programmation, des feuilles de style et des outils simplifiés pour imprimer des images et des documents. Vous pouvez utiliser des langages de script, tels que JavaScript, Java et VBScript, pour gérer les scripts de navigation sur un site Web (une base de données hypertexte hébergée sur le World Wide Web).

La complexité croissante du HTML et l'émergence des langages de programmation ont conduit au fait que le développement de sites Web est devenu une affaire hautement professionnelle, nécessitant une spécialisation dans les domaines d'activité et une étude constante des nouvelles technologies Web. Mais la puissance d'Internet permet aux utilisateurs connaissant les bases du HTML de créer et d'héberger leurs propres sites Web sans grande dépense. C'est pour ces utilisateurs que le cours proposé est conçu.

Conférence 2. BasesHTML. PossibilitésHTML5.

1. Historique du développement du langage HTML

En 1989, Tim Berners-Lee a proposé à la direction du Centre international des hautes énergies (CERN) un projet de système hypertexte distribué, qu'il a appelé le World Wide Web (WWW). L'idée originale du système était d'utiliser un système de navigation hypertexte pour combiner toutes les nombreuses ressources d'information du CERN en un seul système d'information.

L'un des composants de la technologie permettant de créer un système hypertexte distribué sur le World Wide Web était le langage de balisage hypertexte. HTML (HyperTexteBalisageLangue– langage de balisage de document hypertexte), développé par Tim Berners-Lee sur la base du langage de balisage généralisé standard (SGML). Daniel W. Connolly a écrit une définition de type de document à cet effet - une description formelle de la syntaxe HTML en termes SGML.

Les développeurs HTML ont pu résoudre deux problèmes :

    fournir aux concepteurs de bases de données hypertextes un moyen simple de créer des documents ;

    rendre cet outil suffisamment puissant pour refléter la compréhension actuelle de l'interface utilisateur des bases de données hypertextes.

Le premier problème a été résolu en choisissant un modèle de balisage pour la description du document. Ce modèle est largement utilisé dans les systèmes de préparation de documents pour l'impression.

Le langage HTML permet de baliser un document électronique affiché à l'écran avec un niveau de conception d'impression ; le document résultant peut contenir une grande variété d'étiquettes, d'illustrations, de fragments audio et vidéo, etc. Le langage comprend des outils développés pour créer différents niveaux de titres, des sélections de polices, diverses listes, tableaux et bien plus encore.

Le deuxième point important qui a influencé le sort du HTML était qu'un fichier texte ordinaire a été choisi comme base.

Ainsi, une base de données hypertexte au sens WWW est un ensemble de fichiers texte balisés en HTML, qui détermine la forme de présentation de l'information (balisage) et la structure des connexions entre ces fichiers et d'autres ressources d'information (liens hypertextes). Les liens hypertextes, établissant des liens entre des documents texte, ont progressivement commencé à fédérer une grande variété de ressources d'information, notamment sonores et vidéo ; En conséquence, un nouveau concept est apparu : l'hypermédia.

Cette approche présuppose la présence d'un autre composant de la technologie : un interprète de langage. Sur le World Wide Web, les fonctions d'interprétation sont réparties entre le serveur Web de base de données hypertexte et l'interface utilisateur. Le serveur, en plus d'accéder aux documents et de traiter les liens hypertextes, assure le prétraitement des documents, tandis que l'interface utilisateur interprète les constructions linguistiques liées à la présentation des informations.

Versions

    HTML 4.01 (changements plus importants qu'il n'y paraît à première vue) - 24 décembre 1999 ;

    ISO/IEC 15445:2000 (appelé ISO HTML, basé sur HTML 4.01 Strict) – 15 mai 2000.

    HTML 5 - en développement. La fin du développement est prévue pour 2014.

Il n'existe pas de spécification HTML 1.0 officielle. Avant 1995, il existait de nombreuses normes HTML non officielles. Pour rendre la version standard différente d'eux, on lui a immédiatement attribué un deuxième numéro.

La version 3 a été proposée par le World Wide Web Consortium (W3C) en mars 1995 et offrait de nombreuses nouvelles fonctionnalités, telles que la création de tableaux, l'habillage de texte autour d'images et l'affichage de formules mathématiques complexes, ainsi que la prise en charge du format GIF. Même si ce standard était compatible avec la deuxième version, sa mise en œuvre était difficile pour les navigateurs de l’époque. La version 3.1 n'a jamais été officiellement proposée, et la version suivante du standard HTML était la 3.2, qui omettait de nombreuses innovations de la version 3.0 mais ajoutait des éléments non standard pris en charge par les navigateurs Netscape Navigator et Mosaic.

HTML 4.0 a vu un certain nettoyage de la norme. De nombreux éléments ont été marqués comme obsolètes et obsolètes. obsolète). En particulier, l'élément font, utilisé pour modifier les propriétés de la police, a été marqué comme obsolète (les feuilles de style CSS sont recommandées à la place).

En 1998, le World Wide Web Consortium a commencé à travailler sur un nouveau langage de balisage basé sur HTML 4 mais cohérent avec la syntaxe XML. Ensuite nouveau langage appelé XHTML. La première version de XHTML 1.0 a été approuvée en tant que recommandation du World Wide Web Consortium le 26 janvier 2000.

La version prévue de XHTML 2.0 était censée rompre la compatibilité avec les anciennes versions de HTML et XHTML, mais le 2 juillet 2009, le World Wide Web Consortium a annoncé que les pouvoirs groupe de travail XHTML2 expire fin 2009. Ainsi, tout développement ultérieur du standard XHTML 2.0 a été suspendu.

Le World Wide Web Consortium développe actuellement la version HTML 5. Un projet de spécification de langage est apparu sur Internet le 20 novembre 2007.

La base même des technologies Internet les plus avancées en actuellement est le langage HTML le plus utilisé et pourtant le plus controversé. Langage HTML conçu pour le marquage et le formatage de documents sur Internet. Les origines du HTML remontent à 1986, lorsque l'Organisation internationale de normalisation (ISO) a adopté pour la première fois la norme ISO-8879, qu'elle a appelée « Standard Generalized Markup Language » (SGML). Ce langage a ensuite été décrit comme un langage de balisage de texte structurel (logique) et n'impliquait pas la présence même d'une petite description de l'apparence du document. Ainsi, spécifier une description de la taille de la police et de la taille de la police en SGML était considéré comme contraire aux normes de l'époque, car n'a pas fourni l'accessibilité multi-navigateurs et la fonctionnalité multiplateforme du document présenté dans ce formulaire. Mais l'objectif principal de la création de toute norme était précisément d'atteindre cet objectif. Cependant, il convient de noter que SGML n'était pas système prêt à l'emploi pour baliser le texte et ne supposait pas l'existence de l'une ou l'autre liste d'éléments structurels de la langue qui devraient être utilisés dans certaines circonstances. Ce langage impliquait uniquement une description de la syntaxe d'écriture des éléments de base du balisage de texte, qui furent plus tard appelés « balises ». Pour un balisage pratique des documents, il était nécessaire de créer un langage qui décrirait dans quels cas et quel élément de langage spécifique devrait être utilisé et qui fournirait une liste d'éléments de langage pouvant être utilisés pour créer un document et qui devraient être lus par programmes travaillant avec ces documents. Le langage SGML n'a pas reçu de diffusion significative, en fait, ses applications non plus. Ce langage est apparu pour la première fois à l'échelle mondiale en 1991, lorsque l'Institut européen de physique des particules a ressenti le besoin d'un mécanisme permettant de transmettre des informations hypertextes sur Internet. Ensuite, ils ont choisi SGML comme base et un langage a été créé sur cette base. Il est peu probable que quiconque ignore son nom. HTML (Hyper Text Markup Language, « langage de balisage hypertexte »).

La version HTML 1.2 contenait environ 40 balises et n'impliquait aucune description de la présentation physique des documents. Tout a été ramené à la disposition logique et structurelle du texte. Seules quelques balises (d'ailleurs non recommandées) faisaient allusion à distance aux propriétés physiques de la présentation des pages. La description de l'une de ces balises disait : "Lors de la visualisation d'un document créé à l'aide de cette balise, du texte peut apparaître dans navigateurs graphiques en italique gras."

En 1994, le consortium W3 (Ts3S) est créé, qui hérite du droit de dominer le monde Internet de l'Institut européen de physique des particules. Cette organisation s'est immédiatement mise à créer la prochaine spécification HTML, la version 2.0. mais la norme HTML 2.0 finale n'a été adoptée qu'en 1995, alors que les discussions et le développement de HTML 3.0 battaient déjà leur plein. La seule amélioration significative de HTML 2.0 a été l'introduction de formulaires dans le langage, un moyen d'envoyer des informations de l'utilisateur au serveur. La version HTML 3.0 est peut-être la plus grande percée dans les technologies HTML. La version originale de la norme comprenait de nombreuses innovations intéressantes - balises pour créer des tableaux, balisage formules mathématiques, insertion de dessins fluides, de notes, etc. Mais même alors, en 1995, il y avait un besoin de conception visuelle pages hypertextes. Sans casser Les bases du HTML Le W3C a décidé de créer un système distinct pour pouvoir décrire aspect visuel Documents HTML. C'est ainsi qu'apparaissent les spécifications de style hiérarchique (Cascading Style Sheets, CSS), ayant une structure, une syntaxe et des tâches complètement différentes. Il sera abordé plus en détail dans le prochain article.

Bientôt (1995), le premier navigateur commercial, Netscape Navigator, est apparu, ce qui a conduit à la croissance la plus rapide de l'histoire de l'humanité pour la société Netscape Communications. Afin d'attirer de plus en plus de clients, qui étaient déjà plus qu'assez nombreux, la société a commencé à introduire de plus en plus de nouvelles améliorations dans HTML qui n'étaient pas reflétées dans les normes du W3C et n'étaient prises en charge que par Netscape Navigator. Les balises introduites à maintes reprises visaient à améliorer l'apparence des documents et violaient complètement les principes originaux du langage.

En 1996, Microsoft a cessé d'être un observateur passif sur le marché des navigateurs, ce qui a donné naissance au premier Internet Microsoft Explorer 2.0, qui, il faut le dire, n’a pas été très populaire. Plus tard, la 3ème version de ce navigateur a été créée, qui a divisé le marché des navigateurs en deux entre Navigator Communications et Microsoft. Microsoft a pris le W3C sous son aile. En peu de temps, la version 3.2 du standard HTML a été créée, entièrement axée sur Microsoft Internet Explorer.

Jusqu'à récemment, HTML 3.2 restait le seul standard pour ce langage de construction WEB en développement. Cette version de HTML a apporté un peu d'ordre en termes de prise en charge des éléments de balisage dans tous les navigateurs.

Ces dernières années (2004), la dernière version de HTML, HTML 4.01, a été adoptée. Il offre également une compatibilité entre navigateurs et multiplateformes assez élevée.

Il faut dire que ces dernières années, un autre problème lié au HTML est devenu évident. Il ne s’agit pas tant de créer une compatibilité entre navigateurs, mais d’autre chose. Le langage HTML a été créé pour le balisage logique de l'hypertexte et n'impliquait aucune conception de document. Dans les conditions actuelles de développement Internet commercial, les lignes louées à haut débit et les progrès constants des technologies WEB, de nouvelles solutions sont nécessaires qui, en plus du balisage logique, permettront d'interférer avec la conception d'un document, de créer des pages lumineuses et mémorables sur Internet, ce qui est fondamentalement contrairement aux principes du HTML. Dans ces conditions, le CSS devient plus que jamais d’actualité, et les constructeurs WEB y tournent désormais de plus en plus d’attention.

Apparemment, l’histoire du HTML, pleine de luttes et de contradictions, touche à sa fin. Plus précisément, l'histoire de son développement est en voie d'achèvement, puisqu'il sera utilisé pendant longtemps sous une forme plus ou moins inchangée (et, apparemment, proche du moderne). Le monde a accumulé une énorme quantité de ressources qui sont strictement liées à cette langue - et, en outre, malgré toutes ses lacunes, il s'acquitte assez bien de la plus importante de ses responsabilités. Les principaux points de croissance sont désormais d'autres technologies Internet qui ont un rapport assez indirect avec HTML : Java, ActiveX, VRML, et plus récemment diverses technologies push qui permettront aux fournisseurs de « pousser » leurs informations sur les ordinateurs des utilisateurs à la manière de une émission de télévision ou de radio.

En conclusion, il faut dire que les spécifications de toutes les versions de HTML, ainsi que CSS, peuvent être trouvées par tout utilisateur sur le site www.w3c.org.

Histoire du développement HTML.

Le langage de balisage hypertexte HTML (HyperText Markup Language) a été proposé par Tim Berners-Lee en 1989 comme l'un des composants de la technologie de développement du système hypertexte distribué du World Wide Web. Lorsque T. Berners-Lee proposa son système, le monde technologies de l'information Il y avait un intérêt accru pour une nouvelle tendance à la mode à cette époque : les systèmes hypertextes. L'idée elle-même, mais pas le terme, a été introduite par Vanevar Bush en 1945 dans des propositions visant à créer un système électromécanique. Système d'Information Metech, qui était le premier prototype d'un système prenant en charge la lecture et l'écriture de l'hypertexte.

« Ce système utilise l'indexation : si une personne souhaite accéder à un livre, elle tape code requis sur le clavier et le livre ou la page souhaité apparaît devant lui sur l'écran Metech. ... Lorsqu'un utilisateur construit une chaîne associative entre deux documents, il écrit le nom de la chaîne dans le livre de codes. Les chaînes enregistrées sont accessibles à tout moment par l'utilisateur. Ils se forment complètement nouveau livre, qui est stocké à l'intérieur du Metech et peut être rappelé de sa mémoire plusieurs années plus tard... Des formes complètement nouvelles d'encyclopédies apparaissent, contenant des chaînes de documents. Ces chaînes facilitent le travail des spécialistes dans les domaines de la physiologie, de la chimie, de l'histoire et d'autres disciplines. Se pose nouveau métier des pionniers, des gens qui prennent plaisir à créer et à construire des chemins utiles à travers une masse de données ordinaires... Peut-être que l'âme humaine volera plus facilement si nous facilitons la préservation du passé et nous permettons d'analyser plus complètement les problèmes du présent "

(Article de Vannevar Bush « Comment ils pourraient penser »)

La deuxième personne la plus importante de l'histoire de l'hypertexte après Bush est Douglas Engelbart, qui a travaillé sur un projet visant à accroître les capacités de réflexion humaine. Il est important de noter qu’Engelbart et son groupe ont concentré leurs efforts sur l’activation et l’amélioration des capacités cognitives d’un groupe de personnes. De nombreuses fonctionnalités contenues dans NLS ont été largement utilisées relativement récemment. Ces capacités incluent la capacité d'établir des liens hypertextes intégrés au système ; possibilité de stocker des conversations de groupe intégrées aux systèmes de messagerie ; possibilités paramètres personnels, restructuration et expansion du système par les utilisateurs ; opportunités de renforcer non seulement les capacités individuelles mais aussi celles du groupe. Les fichiers dans NLS étaient contenus sous forme de hiérarchies de segments. Chaque segment était appelé une « déclaration ». Chaque « instruction » était dotée d'un identifiant de son niveau dans la structure hiérarchique du fichier. Il était possible d'établir un nombre illimité de connexions de référence entre les « instructions » entre elles, à la fois des connexions intra-fichiers et inter-fichiers. En conséquence, la structure a acquis des propriétés non hiérarchiques et non linéaires. Le système offrait plusieurs façons de naviguer dans un fichier par « instruction ». Les recherches menées dans le cadre de la création du système NLS ont élargi les possibilités de stockage des enregistrements dans la mémoire collective et, surtout, ont considérablement simplifié les mécanismes d'échange d'enregistrements au sein de la communauté en ligne.

Engelbart considère la relation entre les personnes et les programmes comme une communauté hétérogène dans laquelle se produit l'évolution de tous les agents impliqués dans le système. Au sein des complexes informationnels modernes et complexes, il existe une évolution conjointe dans laquelle les personnes et les moyens sont impliqués.

Theodore Nelson, un disciple d'Engelbart, a travaillé à la création d'un système universel de publication électronique et d'archives universelles. Nelson a inventé le terme « hypertexte » en 1965 et a fait beaucoup pour garantir que les idées hypertextes se généralisent. L'hypertexte, selon Nelson, n'est pas structure hiérarchique, parce que les formes vivantes de structures d’information ne peuvent pas être correctement représentées par la hiérarchie. Des structures telles que le parallélisme, les liens croisés, l'interpénétration et la présence simultanée d'un élément à plusieurs endroits ne peuvent pas être véhiculées par la hiérarchie. Nelson considère l’hypertexte comme une communauté multi-agents, au sein de laquelle existent des relations complexes et non hiérarchiques entre les agents.

En 1975, l'idée de l'hypertexte s'incarne dans le système d'information interne du porte-avions nucléaire Carl Winston. Le programme ressemblait beaucoup à l’aspect plus simplifié du Total Commander moderne. Les travaux sur la création de programmes hypertextes se sont poursuivis et de temps en temps, des implémentations telles que HyperCard d'Apple ou HyperNode de Xerox sont apparues. En 1987, a eu lieu la première conférence spécialisée Nupertext"87, dont les matériaux ont été consacrés à un numéro spécial de la revue "Communication ACM". L'idée d'un système d'information hypertexte est que l'utilisateur a la possibilité de afficher les documents (pages de texte) dans l'ordre qui lui convient le mieux, et non séquentiellement, comme il est d'usage lors de la lecture de livres.

À la fin des années 80, l'hypertexte peut avoir les caractéristiques suivantes définition générale: l'hypertexte est un texte dans lequel sont insérés des mots de balisage (commandes) qui font référence à d'autres endroits de ce texte, à d'autres documents, images, etc. En terminologie informatique, l'hypertexte est un texte généré à l'aide d'un langage de balisage, contenant potentiellement des liens. Ces définitions restent pertinentes à ce jour.

En 1989, l'hypertexte représentait une nouvelle technologie prometteuse qui avait un nombre relativement important d'implémentations d'une part, et d'autre part, des tentatives ont été faites pour construire des modèles formels de systèmes hypertextes qui étaient de nature plus descriptive et inspirés par le succès de l’approche relationnelle de description des données.

L'idée de T. Berners-Lee était d'appliquer le modèle hypertexte aux ressources d'information distribuées sur le réseau, et de le faire autant que possible. d'une manière simple.

L'idée du HTML est un exemple de solution extrêmement réussie au problème de la construction d'un système hypertexte utilisant moyens spéciaux commandes d’affichage. Le développement du langage de balisage hypertexte a été fortement influencé par deux facteurs : la recherche dans le domaine des interfaces des systèmes hypertextes et le désir de fournir des façon rapide création d'une base de données hypertexte distribuée sur un réseau.

En 1989, le problème de l'interface des systèmes hypertextes a été activement discuté, c'est-à-dire procédés d'affichage d'informations hypertextes et de navigation dans le réseau hypertexte. Signification technologie hypertexte par rapport à l’importance de l’imprimerie. Il a été avancé qu'une feuille de papier et un moyen d'affichage/de reproduction sur ordinateur sont très différents les uns des autres et que, par conséquent, la forme de présentation de l'information devrait également être différente. Les liens hypertextes contextuels ont été reconnus comme la forme la plus efficace d'organisation hypertexte, et en outre, la division en liens associés à l'ensemble du document dans son ensemble et à ses parties individuelles a été reconnue.



Le moyen le plus simple de créer un document est de le saisir dans un éditeur de texte. T. Berners-Lee avait l'intention de combiner les ressources d'information existantes du CERN (Organisation européenne pour la recherche nucléaire, le plus grand laboratoire de physique des hautes énergies au monde) en un seul système, et les premiers systèmes de démonstration devaient être des systèmes pour NeXT et VAX/VMS. . Les éditeurs TeX ou LaTeX ont été utilisés pour rédiger des textes.

Généralement, les systèmes hypertextes ont des caractéristiques particulières. logiciel construire des connexions hypertextes. Les liens hypertextes eux-mêmes sont stockés dans des formats particuliers voire constituent des fichiers particuliers. Cette approche est bonne pour système local, mais pas pour être distribué sur de nombreuses plates-formes informatiques différentes.

En HTML, les liens hypertextes sont intégrés dans le corps du document et stockés dans celui-ci. Les systèmes utilisent souvent des formats de stockage de données spéciaux pour améliorer l'efficacité de l'accès. Sur WWW, les documents sont des fichiers ASCII ordinaires qui peuvent être préparés dans n'importe quel éditeur de texte. Ainsi, le problème de la création d'une base de données hypertexte a été résolu de manière extrêmement simple.

SGML (Standard Generalized Markup Language - un métalangage dans lequel vous pouvez définir un langage de balisage pour les documents) a été choisi comme base pour le développement d'un langage de balisage hypertexte. Suivant la tradition académique, Berners-Lee a décrit HTML en termes de SGML (comme un langage de programmation est décrit en termes de forme Backus-Naur). Naturellement, tout le balisage associé à la mise en évidence des paragraphes, des polices, des styles, etc. a été implémenté en HTML, car l'implémentation NeXT impliquait une interface graphique. Un élément important du langage est la description des liens hypertextes intégrés et associés, des graphiques intégrés et la possibilité de rechercher par mots-clés.

Il n'existe pas de spécification HTML 1.0 officielle. Avant 1995, il existait de nombreuses normes HTML non officielles. Pour rendre la version standard différente d'eux, on lui a immédiatement attribué un deuxième numéro.

La version 3 a été proposée par le World Wide Web Consortium (W3C) en mars 1995 et offrait de nombreuses nouvelles fonctionnalités telles que la création de tableaux, l'habillage de texte autour d'images et l'affichage de formules mathématiques complexes. Même si ce standard était compatible avec la deuxième version, sa mise en œuvre était difficile pour les navigateurs de l’époque. La version 3.1 n'a jamais été officiellement proposée, et la version suivante du standard HTML était la 3.2, qui omettait de nombreuses innovations de la version 3.0 mais ajoutait des éléments non standard pris en charge par les navigateurs Netscape et Mosaic.

La version HTML 4.0 contient de nombreux éléments spécifiques à navigateurs individuels, mais en même temps il y a eu un certain « nettoyage » de la norme. De nombreux éléments ont été marqués comme obsolètes et obsolètes. En particulier, l'élément font, utilisé pour modifier les propriétés de la police, a été marqué comme obsolète (des feuilles de style CSS sont recommandées à la place).

Le World Wide Web Consortium développe actuellement la version HTML 5. Un projet de spécification de langage est apparu sur Internet le 20 novembre 2007. En parallèle, des travaux sont en cours sur la poursuite du développement HTML appelé XHTML (anglais : Extensible Hypertext Markup Language). Bien que XHTML ait des capacités comparables à celles de HTML, ses exigences en matière de syntaxe sont plus strictes. Comme HTML, XHTML est un sous-ensemble du langage SGML, mais XHTML, contrairement à son prédécesseur, est basé sur XML. XHTML 1.0 a été approuvé en tant que recommandation du World Wide Web Consortium le 26 janvier 2000.

La spécification XHTML 2.0 prévue rompt la compatibilité avec les anciennes versions de HTML et XHTML, ce qui ne convient pas à certains développeurs Web et créateurs de navigateurs. Le WHATWG (Web Hypertext Application Technology Working Group) développe la spécification Web Applications 1.0, souvent appelée de manière informelle "HTML 5", qui étend HTML (mais possède également une syntaxe XML compatible XHTML 1.0) pour mieux représenter la sémantique de diverses pages typiques, par exemple. exemples de forums, de sites d'enchères, moteurs de recherche, boutiques en ligne, etc., qui ne rentrent pas très bien dans le modèle XHTML 2.