Langage Signalétique Hyper Text. Technologies Web

Langage Signalétique Hyper Text(HTML) – langage de balisage hypertexte – est destiné à la rédaction de documents hypertextes publiés en Mondial La toile.

Document hypertexte est un fichier texte comportant des marques spéciales appelées balises, qui sont ensuite reconnues par le navigateur et utilisées par celui-ci pour afficher le contenu du fichier sur l'écran de l'ordinateur. À l'aide de ces marques, vous pouvez mettre en évidence les titres des documents, modifier la couleur, la taille et le style des lettres et insérer des graphiques et des tableaux. Mais le principal avantage de l'hypertexte par rapport au texte ordinaire est la possibilité d'ajouter au contenu d'un document hyperliens– des constructions spéciales du langage HTML qui vous permettent de cliquer sur une souris pour afficher un autre document.

Il existe deux manières de créer des documents hypertextes. Vous pouvez utiliser l'un des éditeurs HTML WYSIWYG (par exemple, Microsoft FrontPage, etc.), qui ne nécessitent pas de connaissances particulières sur la structure interne du document en cours de création. Cette méthode permet de créer des documents pour le WWW sans connaissance du HTML. Les éditeurs HTML automatisent la création de documents hypertextes et éliminent le travail de routine. Cependant, leurs capacités sont limitées, ils augmentent considérablement la taille du fichier résultant et le résultat obtenu avec leur aide ne répond pas toujours aux attentes du développeur. Mais bien entendu, cette méthode est indispensable pour les débutants dans la préparation de documents hypertextes.

Une alternative consiste à créer et à annoter un document à l'aide d'un éditeur de texte classique (NotePad). Avec cette méthode, les commandes HTML sont insérées manuellement dans le texte. En créant des documents de cette manière, vous savez exactement ce que vous faites.

Comme déjà indiqué, un document HTML contient des informations sur les caractères. Une partie de celui-ci est le texte lui-même, c'est-à-dire les données qui composent le contenu du document. Un autre - Mots clés(balises de balisage), également appelées indicateurs de balisage, sont des constructions spéciales du langage HTML utilisées pour baliser un document et contrôler son affichage. Ce sont les balises du langage HTML qui déterminent sous quelle forme le texte sera présenté, lesquels de ses composants feront office de liens hypertextes et quels objets graphiques ou multimédias devront être inclus dans le document. Les informations graphiques et audio incluses dans un document HTML sont stockées dans des fichiers séparés. Les visualiseurs de documents HTML (navigateurs) interprètent les indicateurs de balisage et organisent le texte et les graphiques à l'écran en conséquence. Pour les fichiers contenant des documents HTML, les extensions .htm ou .html sont acceptées.

Majuscules et minuscule les balises ne diffèrent pas lors de l’enregistrement. Dans la plupart des cas, les balises sont utilisées par paires. La paire se compose d’une balise d’ouverture (balise de début) et d’une balise de fermeture (balise de fin). Syntaxe de la balise d'ouverture :

<имя_тега [атрибуты]>

Les parenthèses directes utilisées dans une description syntaxique indiquent que l'élément peut être manquant. Le nom de la balise fermante diffère du nom de la balise ouvrante uniquement par le fait qu'il est précédé d'une barre oblique :

Les attributs des balises sont écrits au format suivant :

nom[="valeur"]

Les guillemets lors de la spécification de la valeur de l'argument sont facultatifs et peuvent être omis. Pour certains attributs, une valeur peut ne pas être spécifiée. La balise fermante n'a aucun attribut.

L'action de toute balise appariée commence là où la balise d'ouverture est rencontrée et se termine lorsque la balise de fermeture correspondante est rencontrée. Souvent, une paire composée d'une balise d'ouverture et d'une balise de fermeture est appelée récipient, et la partie du texte bordée par les balises d'ouverture et de fermeture est élément.

La séquence de caractères qui compose le texte peut être constituée d'espaces, de tabulations, de nouvelles lignes, de retours chariot, de lettres, de signes de ponctuation, de chiffres et de caractères spéciaux (par exemple, +, #, $, @), à l'exception de les quatre caractères suivants, qui ont une signification particulière en HTML :< (меньше), >(supérieur à), & (ampersend) et " (guillemet double). Si vous devez inclure l'un de ces caractères dans votre texte, vous devez l'encoder avec une séquence de caractères spéciale.

Structure des documents HTML

Le plus important de Balises HTML est la balise du même nom – . Il devrait toujours ouvrir votre document, tout comme une balise doit certainement apparaître dans sa dernière ligne. Ces balises indiquent que les lignes entre elles représentent un seul document hypertexte. Sans ces balises, un navigateur ou un autre visualiseur est incapable d'identifier le format du document et de l'interpréter correctement.

La balise de fermeture est tout aussi importante que la balise d'ouverture. Si, par exemple, le document est inclus dans e-mail, étiqueter demande au spectateur d'arrêter d'interpréter le texte comme du code HTML.

Un document HTML se compose de deux parties : un en-tête et un corps, disposés dans l'ordre suivant :

Vous pouvez inclure dans un document HTML commentaires, vous permettant de masquer une partie du texte du navigateur. Tout ce qui est contenu entre des séquences de caractères, reste invisible lors de la visualisation de la page. Les commentaires ne peuvent pas être imbriqués les uns dans les autres

L'inclusion d'un en-tête dans le document est facultative. Le travail de l'en-tête consiste à présenter les informations nécessaires au navigateur et au serveur HTTP. Les informations placées à l'intérieur de l'en-tête du document ne sont généralement pas affichées à l'écran (à l'exception du titre du document).

Le titre du document s'ouvre avec la balise , qui suit généralement immédiatement la balise . Balise de fermeture montre la fin de cette section, avec les balises de titre du document restantes entre les deux.

Le plus souvent, une balise appariée est incluse dans le titre du document ... , définissant le titre du document. De nombreux spectateurs l'utilisent comme titre de la fenêtre dans laquelle le document est affiché. Les programmes qui indexent des documents sur Internet utilisent le titre pour identifier la page. Un bon titre doit être suffisamment long pour identifier correctement la page correspondante, mais en même temps il doit tenir dans le titre de la fenêtre. Le titre du document s'insère entre les balises d'ouverture et de fermeture. Corps du document

Contrairement à l'en-tête, le corps du document est un élément obligatoire, car il contient tout le contenu de votre document (il n'y a qu'une seule exception, que nous connaîtrons plus tard - lorsque le document contient un groupe de cadres au lieu d'un corps ). Le corps du document est placé entre les balises Et. Tout ce qui est placé entre ces balises est interprété par le navigateur selon les règles du langage HTML, ce qui permet à la page de s'afficher correctement sur l'écran du moniteur.

Étiqueter marque non seulement le début du contenu du document, mais définit également ses propriétés de base : couleur d'arrière-plan, texte et bien plus encore. Ces propriétés sont définies à l'aide des attributs indiqués dans le tableau.

Ma page Corpsdocument

Déterminer la couleur des composants d'un document est l'une des premières étapes de sa création. Si cela n'est pas fait, les couleurs par défaut déterminées par les paramètres du navigateur seront utilisées. Il n’existe aucune règle pour créer une palette de couleurs de document bien équilibrée. Vous devez simplement vous assurer que vous pouvez lire le texte sans aucun inconvénient. Au moment de choisir palette de couleurs Essayez de maintenir un contraste élevé entre le texte et l’arrière-plan et évitez les zones de couleurs similaires adjacentes les unes aux autres.

La couleur peut être spécifiée par un nom (par exemple, vert) ou un nombre hexadécimal qui définit la couleur dans le modèle RVB. Ce modèle de couleur est basé sur la définition de la couleur comme une composition de trois nuances de couleur primaires : rouge (Rouge), vert (Vert) et bleu (Bleu). Chaque composant est spécifié par un nombre hexadécimal à deux chiffres (c'est-à-dire compris entre 00 et FF). Ces valeurs sont ensuite regroupées en un seul nombre, précédé du symbole # (la plupart des navigateurs modernes peuvent reconnaître la couleur sans préciser le symbole #).

Vous trouverez ci-dessous un tableau des 16 couleurs standards ainsi que leurs codes hexadécimaux.

noir noir)

argent (argent)

marron (bordeaux foncé)

rouge rouge)

vert

chaux (chaux)

olive (olive)

jaune

marine (bleu foncé)

bleu bleu)

violet

fuchsia (fuchsia)

sarcelle (bleu-vert)

gris

blanc Blanc)

Langage HTML suppose que l'auteur du document ne sait rien de l'ordinateur du lecteur. Le lecteur a le droit de définir n'importe quelle taille de fenêtre et d'utiliser n'importe quelle police à sa disposition. Cela signifie que l'emplacement du trait d'union est déterminé uniquement par les paramètres du spectateur et de l'utilisateur final. Les caractères de saut de ligne dans le document d'origine sont ignorés, ce qui peut entraîner le rendu d'un texte qui s'affiche parfaitement dans la fenêtre de votre éditeur sous la forme d'un simple texte illisible dans la fenêtre de visualisation.

Vous pouvez éviter ce problème en divisant en paragraphes à l'aide de la balise<Р>.Placez-le au début de chaque paragraphe et le spectateur séparera les paragraphes par une ligne vierge. Utiliser une balise de fermeture

pas nécessaire. Plusieurs balises à la suite<Р>ne prévoyez pas d’espace supplémentaire entre les paragraphes.

Parfois, il est nécessaire de « casser » le texte, en déplaçant le reste vers une nouvelle ligne, sans sélectionner de nouveau paragraphe. Cela se fait à l’aide de la balise de saut de ligne.
.Il oblige le spectateur à afficher les caractères qui le suivent sur une nouvelle ligne. Contrairement à la balise paragraphe, la
n'ajoute pas de ligne vide. Cette balise n'a pas de balise de fermeture appariée.

Exemple

Joseph Brodski

D'où vient l'hiver ?

Vous ne savez pas, personne ne le sait.

Tout devint silencieux. Elle-même

ne desserre pas ses lèvres froides.

Certains navigateurs interprètent plusieurs balises adjacentes
comme une seule balise, vous ne devriez donc pas l'utiliser pour insérer des lignes vides.

    Une autre méthode pour diviser un document en plusieurs parties consiste à tracer des lignes horizontales. Ils soulignent visuellement l'exhaustivité d'une zone particulière de la page. Étiqueter


    permet un soulagement ligne horizontale dans la fenêtre de la plupart des programmes de visualisation. Cette balise ne nécessite pas de balise de fermeture. Une ligne vierge est automatiquement insérée avant et après la ligne.

Bien que HTML inclut des balises pour obtenir divers effets de police (gras, italique, souligné), tous les navigateurs ne les prennent pas en charge. Cependant, tous les navigateurs prennent en charge d'une manière ou d'une autre la sélection de texte. Par conséquent, l’utilisation d’un formatage logique du texte amènera dans tous les cas le spectateur à mettre en évidence différentes parties du texte et à révéler la structure du document.

Titre du document spécifié à l'aide d'une balise , n'est pas affiché dans le cadre du document. Pour afficher le titre, l'une des balises de titre est utilisée. Les titres d'un document typique sont divisés en niveaux. Le langage HTML permet de définir six niveaux de titres : H1 (titre de premier niveau), H2, H3, H4, H5 et H6. Le titre du premier niveau est généralement plus grand et plus riche que le titre du deuxième niveau.</p><p><b>Exemple</b></p><p><TITLE>Rubriques

En-tête de niveau 1

En-tête de niveau 2

En-tête de niveau 3

En-tête de niveau 4

En-tête de niveau 5

En-tête de niveau 6

N'oubliez pas que si vous oubliez d'inclure une balise de titre de fermeture, la page aura l'air déformée : toute balise de titre insère automatiquement une ligne vide avant et après elle-même.

L'une des différences entre un document HTML et un document préparé sur une machine à écrire est la possibilité de formater le texte. Le langage HTML permet à l'auteur d'un document de choisir la police qu'il préfère, taille appropriée lettres, leur couleur et leur style. Les balises de formatage physique sont responsables de toutes ces options d’affichage de texte. Ils affectent tous les caractères entre les balises d'ouverture et de fermeture.

Mots clés

Application

Résultat

Audacieux

Audacieux

Italique

Italique

Stressé

Stressé

Machine à écrire

Machine à écrire

Barrée

Barrée

Grand

Petit

Petit

Haut -- x indice

Supérieur -- indice x

En bas -- x indice

Inférieur -- indice x

Les éléments de formatage physique peuvent être imbriqués, bien que le résultat final varie selon le navigateur. Dans ce cas, vous devez vous assurer soigneusement qu'un conteneur se trouve entièrement dans un autre conteneur, par exemple :

texte en gras et souligné

En plus des balises ci-dessus, le document peut utiliser la balise , qui vous permet de définir directement la taille et la couleur de la police. L'élément FONT est un conteneur, ce qui signifie qu'il nécessite à la fois des balises d'ouverture et de fermeture et peut lui-même être utilisé dans n'importe quel autre conteneur de texte.

Après la balise de début, il est nécessaire d'indiquer les attributs, sans lesquels l'élément n'a aucun effet sur le texte placé dans le conteneur.

L'attribut FACE vous permet de spécifier le type de police que le spectateur utilisera pour afficher votre texte (si l'utilisateur en possède un). Si la police souhaitée non, le programme ignorera la demande et utilisera la police par défaut.

Cet attribut permet de spécifier une ou plusieurs polices (séparées par des virgules). La liste entière sera numérisée de gauche à droite et la première disponible sur la machine de l'utilisateur sera utilisée pour afficher le document.

L'attribut SIZE permet d'indiquer la taille de la police en unités arbitraires de 1 à 7. On considère que la taille d'une police « normale » correspond au chiffre 3. La taille peut être soit une valeur absolue (SIZE=5) soit une valeur relative (TAILLE=+2). Dans le deuxième exemple, la taille de police actuelle est augmentée de 2.

L'attribut COLOR définit la couleur de la police, qui peut être spécifiée comme dans Format RVB, et en indiquant le nom.

Exemple

Texte Rouge Et

grande taille

Malgré le fait qu'un document HTML comprend une variété de composants, on peut dire que liens hypertextes- la base du WWW. Si les pages Web n'étaient pas liées les unes aux autres, le contenu Web ne deviendrait qu'un ensemble de fichiers sans rapport.

Une paire de balises permet de créer un lien hypertexte .... Un morceau de texte, une image ou tout autre objet situé entre ces balises s'affiche dans la fenêtre du navigateur sous forme de lien hypertexte. L'activation d'un tel objet entraîne le chargement d'un nouveau document dans la fenêtre du navigateur ou l'affichage d'une autre partie de la page Web actuelle. Un lien hypertexte se forme à l'aide de l'expression

fragment de document

HREF est ici un attribut obligatoire, dont la valeur est l'URL de la ressource demandée. Les guillemets spécifiant la valeur de l'attribut HREF sont facultatifs.

Index de texte, c'est-à-dire que les fragments de texte qui sont des liens ne diffèrent pas en apparence. Typiquement cet indicateur est un ou plusieurs mots soulignés par un trait droit. La couleur du pointeur peut être ajustée par les paramètres du programme d'auteur et de visualisation.

Pointeurs graphiques, c'est-à-dire que les images des liens sont mises en évidence avec un cadre de la même couleur que les indicateurs de texte.

Exemple

Les normes HTML prennent actuellement en charge les balises pour trois types différents de listes : les listes numérotées (ordonnées), à puces (non ordonnées) et les listes de définitions. Les listes et les éléments de liste sont des éléments de bloc. Cela signifie que des lignes vides sont automatiquement ajoutées avant et après elles.

Le langage HTML permet l'imbrication de tout type de listes. Pour ce faire, placez une paire de balises (début et fin) dans l’autre. N'oubliez pas que toutes les listes existantes doivent se terminer par une balise de fermeture.

Les listes numérotées (ordonnées) sont utilisées lorsque l'ordre dans lequel les éléments de la liste sont affichés est important. Le navigateur insère automatiquement les numéros d'éléments dans l'ordre ; les numéros ne sont pas imprimés dans le texte HTML d'origine. Si le nombre d'éléments de la liste change (suite à la suppression ou à l'ajout de nouveaux éléments), la numérotation sera automatiquement mise à jour.

La liste numérotée entière est entourée d'une paire de balises et chaque élément de la liste est entouré de balises.

  • Et
  • (balise de fermeture peut-être manquant).

  • La programmation
  • Algorithmisation
  • Conception
  • Une liste à puces (non ordonnée) est utilisée pour représenter une collection d’éléments dont l’ordre n’a pas d’importance. Lors de l'affichage de listes à puces, le navigateur insère automatiquement des icônes spéciales (marqueurs) pour marquer chaque élément de la liste.

    Une liste à puces commence par une balise de début

      et se termine par la balise
    . Chaque élément de la liste commence par une balise
  • et se termine par une balise (facultatif)
  • .

    Exemple

  • La programmation
  • Algorithmisation
  • Conception
  • N'importe quelle liste peut faire partie d'une autre liste, imbriquée dans une autre liste. Il est jugé utile d'utiliser des décalages lors de la préparation du texte du document HTML source afin de représenter clairement les niveaux d'imbrication des listes.

  • Direction
  • Ivanov I.I.
  • Petrov K.V.
  • Département commercial
  • Varshavskaïa E.L.
  • Samsonov D.M.
  • Lors de l'affichage de listes à puces imbriquées, le navigateur place automatiquement des puces devant les éléments dans le différents niveaux nidification.

    Tableau - méthode efficace afficher des données statistiques ou des informations plus pratiques à présenter sous cette forme. Les données du tableau sont stockées dans des cellules, qui sont les champs individuels qui composent les lignes et les colonnes du tableau. Les inscriptions placées au-dessus des colonnes et décrivant leur contenu sont appelées en-tête du tableau.

    Lors de la formation d'un tableau, plusieurs balises appariées sont utilisées.

    Et
    . Indiquez le début et la fin du tableau. Toutes les autres balises et le texte du tableau doivent apparaître entre ces deux balises.

    Et. Marquez le début et la fin d'une ligne. Tous les en-têtes et cellules de n’importe quelle ligne doivent se trouver entre ces deux balises.

    <ТН>Et. Définit le début et la fin de la cellule d'en-tête du tableau.

    Et. Marquez le début et la fin de la cellule de données.

    Aussi, en utilisant la balise , placé à l'intérieur de la balise

    vous pouvez créer un en-tête de tableau.

    <ТН>Nom du membre du club

    <ТН>Avez-vous visité un club de lecture?

    <ТН>Date de visite

    <ТD>Pas de données

    <ТD>Nikolaï

    Présence de l'attribut BORDER dans la balise

    HélèneNonOui
    indique que les cellules du tableau sont délimitées par des lignes.

    Le résultat sera un tableau :

    Pour ajouter une image, vous devez saisir la balise à l'endroit de la page Web où elle doit apparaître . L'attribut SRC est utilisé pour spécifier le nom du fichier contenant l'image. Exemple:

    Selon l'endroit où est stocké ce fichier, le chemin est indiqué dans la balise : absolu ou relatif.

    Langages de balisage hypertexte SGML. XML. HTML.

    SGML(Anglais : Standard Generalized Markup Language - langage de balisage généralisé standard ; prononcé [s-ji-em-el]) - un métal-langage dans lequel vous pouvez définir un langage de balisage pour les documents. SGML est le successeur du GML (Generalized Markup Language) développé en 1969 chez IBM, qu'il ne faut pas confondre avec le Geography Markup Language développé par l'Open GIS Consortium.

    SGML a été initialement développé pour le partage de documents lisibles par machine dans le cadre de grands projets gouvernementaux et aérospatiaux. Il était largement utilisé dans les industries de l’imprimerie et de l’édition, mais sa complexité rendait difficile son adoption à grande échelle pour un usage quotidien.

    Principales parties du document SGML :

    Déclaration SGML - définit quels caractères et délimiteurs peuvent apparaître dans l'application ;

    Définition du type de document : définit la syntaxe des constructions de balisage. La DTD peut inclure des définitions supplémentaires, telles que des références symboliques ;

    La spécification sémantique, qui fait référence au balisage, donne également des restrictions syntaxiques qui ne peuvent pas être exprimées dans une DTD ;

    Contenu du document SGML - il doit au moins y avoir un élément racine.

    SGML fournit une variété d'options de balisage syntaxique utilisables par diverses applications. En modifiant la déclaration SGML, vous pouvez même abandonner l'utilisation des crochets angulaires, bien que cette syntaxe soit considérée comme standard, ce qu'on appelle la syntaxe de référence concrète.

    Exemple de syntaxe SGML :

    généralement quelque chose comme ce

    SGML est normalisé par l'ISO : « ISO 8879 : 1986 Traitement de l'information – Systèmes de texte et de bureautique – Langage de balisage généralisé standard (SGML) »

    HTML et XML sont dérivés de SGML. HTML est une application de SGML et XML est un sous-ensemble de SGML conçu pour simplifier le processus d'analyse automatique d'un document. Les autres applications SGML sont SGML Docbook (documentation) et "Z Format" (typographie et documentation).

    XML- Extensible Markup Language, c'est-à-dire Extensible Markup Language, est né du développement du langage HTML (HyperText Markup Language, langage de balisage hypertexte). Cependant, ce serait une grave erreur de le percevoir uniquement comme une version améliorée du langage HTML. Essentiellement, XML est une nouvelle génération de langages de balisage. Ici, vous devez garder à l'esprit 3 points qui distinguent fondamentalement XML du HTML et de ses prédécesseurs (GML - Generalized Markup Language, SGML - Standard General Markup Language) :

    XML, contrairement à HTML, N'A PAS DE BALISE PRÉDÉFINIES - plus précisément, chaque développeur peut créer SES PROPRES balises XML - autant que nécessaire. Le nombre de ces balises est pratiquement illimité. Ainsi, XML est un métalangage qui permet la création d'autres langages de balisage, comme HTML.

    À mesure que le langage HTML évoluait, le nombre de balises augmentait rapidement. Finalement, leur nombre a atteint une « valeur critique » - il est devenu difficile pour les développeurs de documents Web de mémoriser de plus en plus de nouvelles balises, mais les développeurs de navigateurs se sont retrouvés dans une position encore pire - ils ont dû créer de nouvelles versions de navigateurs qui « comprendraient » de nouvelles balises. Les navigateurs plus intelligents deviennent également de plus en plus grands et imposent des exigences toujours croissantes aux ordinateurs sur lesquels ils sont utilisés. Le problème est aggravé par le fait que ces derniers temps, les appareils portables sont devenus de plus en plus populaires (en particulier, ils sont de plus en plus utilisés dans le commerce électronique), avec une mémoire limitée et des écrans « faibles », et donc les navigateurs utilisés sur eux n'ont que des possibilités très limitées. . XML, qui n'a pas de système de balises prédéfini, résout ce problème. Le « paiement » de la polyvalence est une plus grande rigueur dans la conception des documents Web. Les règles de formatage des documents XML sont simples :

    Les conteneurs de balises non fermés ne sont pas autorisés (mais vous pouvez combiner les balises d'ouverture et de fermeture en une seule, par exemple :
    )

    les conteneurs « imbriqués » ne peuvent pas « se chevaucher »

    les lettres minuscules et majuscules sont traitées comme des caractères différents

    Les mots clés ne peuvent pas être utilisés comme noms de balises

    Vous ne pouvez pas utiliser d'espaces, de signes de ponctuation, d'accolades, de carrés ou d'accolades dans les noms de balises.

    Le trait de soulignement (_) et les chiffres peuvent apparaître dans les noms de variables, mais un nombre ne peut pas être le premier caractère d'un nom de variable.

    (Si vous devez utiliser plusieurs mots comme nom de balise, ils doivent être écrits ensemble, en commençant chaque mot par une lettre majuscule.)

    Les documents qui répondent à ces règles sont appelés documents bien formés.

    XML est utilisé pour DÉCRIRE DES STRUCTURES DE DONNÉES, principalement des STRUCTURES HIÉRARCHIQUES.

    L'une des principales tendances dans le développement des technologies Web est la SÉPARATION DES DONNÉES, DE LA STRUCTURE DU DOCUMENT ET DE SA CONCEPTION DE STYLE. Comme vous le savez, l'un des moyens de séparer les données de la structure du document consiste à lier dynamiquement le SGBD aux documents Web via l'interface ODBC (Open DataBase Connectivity). La séparation des styles est obtenue grâce à l'utilisation de feuilles de style en cascade. XML vous permet de décrire des bases de données non relationnelles. Étant donné que les balises peuvent être créées par le développeur, leurs noms décrivent généralement la signification des données.

    XML, en tant que moyen de décrire la structure des données, permet l'ÉCHANGE DE DONNÉES entre différentes applications, agissant ainsi comme une sorte de « colle ».

    L'importance de cette fonction de « colle » XML ne peut être surestimée. Grâce à la possibilité d’échanger des données entre diverses applications, les technologies Web « atteignent » un tout autre niveau.

    Langage de balisage hypertexte (HTML) est un système simple de création de documents hypertextes portables d'une plateforme à une autre. Essentiellement, les documents HTML sont des documents SGML dotés d'une sémantique commune, adaptés à la représentation d'informations dans un large éventail d'applications. HTML peut être utilisé pour représenter :

    · Actualités hypertextes, courrier, documentation et hypermédia

    Menu d'options

    · Résultats de requête de base de données

    · Documents simples avec des graphiques intégrés

    · Et également pour la visualisation hypertexte des tableaux d'informations existants

    Le projet World Wide Web (WWW) rassemble des informations dispersées à travers le monde. Pour ce faire, WWW utilise Internet HyperText Transfer Protocol (HTTP) - le HyperText Transfer Protocol, qui vous permet de conclure des accords sur les méthodes de présentation des données lors de l'interaction entre un client et un serveur.



    Les données sont transmises dans le corps du message conformément à la norme MIME. HTML est l'une des représentations d'informations sur le WWW. HTML est supposé correspondre à l'un des types MIME, à savoir text/html. De plus, HTML est développé conformément à la norme internationale ISO 8879 - Standard Generalized Markup Language (SGML), qui est un système permettant de définir des types de documents structurés.

    Document HTML

    Un document HTML est similaire à un fichier texte, sauf que certains caractères (lignes) sont des caractères de contrôle. Ces symboles sont appelés balises et définissent la structure du document.

    Les documents HTML doivent commencer par la balise , situé au début du fichier, et se termine par la balise. Entre ces balises, le document HTML est organisé comme un document HEAD et BODY, semblable à un message électronique. À l'intérieur de la partie HEAD, le TITRE et d'autres informations sur le document dans son ensemble sont indiqués. À l'intérieur de la partie BODY, à l'aide de balises HTML, le texte est structuré en paragraphes, listes, etc. avec la possibilité de mettre en évidence des mots individuels et des phrases entières avec un style et de créer des liens vers des parties de ce document et des documents externes. Techniquement, il n'est pas nécessaire d'utiliser les balises d'ouverture et de fermeture pour les éléments HTML, HEAD et BODY. Toutefois, cela n'est pas recommandé car la structure HEAD/BODY permet aux applications de déterminer les caractéristiques du document (telles que l'en-tête) sans numériser l'intégralité du document.

    Structure des éléments HTML

    Dans un document HTML, les balises définissent le début et la fin des titres, des paragraphes, des listes, la mise en surbrillance des caractères et les liens. La plupart des éléments HTML d'un document sont définis comme une balise d'ouverture, qui spécifie le nom et les attributs de l'élément, puis le corps de l'élément, suivi d'une balise de fermeture. Les caractères délimiteurs de la balise d'ouverture sont "<" и ">"; pour fermer - "". Par exemple:

    C'est le titre

    Ceci est un paragraphe.

    Certains éléments apparaissent uniquement sous forme de balise d'ouverture. Par exemple, pour créer une ligne de séparation, utilisez la balise
    . De plus, les balises fermantes de certains éléments (P, LI, DT, DD) peuvent être omises. Le corps d'un élément est une séquence de caractères et d'éléments imbriqués. Certains éléments, tels que les éléments qui définissent des liens, ne peuvent pas être imbriqués. Dans ce cas, les éléments définissant les liens et les sélections de caractères peuvent être placés à l'intérieur d'autres structures.

    Afficher un document

    L'affichage spécifique d'un document peut varier d'un client à l'autre. Les balises HTML déterminent uniquement le style d'affichage général du document. Cela signifie, par exemple, que HTML traite le titre de premier niveau comme un simple titre de premier niveau, mais ne précise pas que le titre de premier niveau doit apparaître dans la police Times de taille 24, centrée en haut de la page. L'avantage de cette approche est que si l'utilisateur décide de changer l'en-tête de premier niveau en police Helvetica de taille 20 alignée à gauche, il lui suffit de modifier la définition de l'en-tête de premier niveau dans son visualiseur WWW. Ainsi, la présentation spécifique du document sur l'écran du moniteur est déterminée par l'utilisateur d'un client particulier.

    La principale force du HTML réside dans sa capacité à lier des zones de texte (mais aussi des images) à d’autres documents. Les téléspectateurs mettent en évidence ces zones (généralement avec de la couleur et/ou en soulignant) pour indiquer qu'il s'agit de liens hypertextes. Une ancre est un morceau de texte qui marque le début et/ou la fin d'un lien hypertexte. Le texte entre les balises d'ouverture et de fermeture est le point de départ ou la destination d'un lien hypertexte. Les attributs de cette balise sont les suivants : HREF

    Facultatif. Si l'attribut HREF est présent, Anchor est un texte sensible : le point de départ du lien. Si le lecteur sélectionne ce texte, il se verra présenter un autre document dont l'adresse réseau a été précisée dans la valeur de l'attribut HREF. Le format de l'adresse réseau est similaire à une URL. Cela permet à la structure HREF="#identifier" de faire référence à une autre ancre dans le document courant, ou dans un document distant en précisant son adresse avant le signe "#".

    Facultatif. S'il est présent, permet d'utiliser l'ancre comme destination de lien. La valeur de l'attribut est l'identifiant d'ancrage. Une chaîne de texte normale peut être utilisée comme valeur d'identifiant, sauf que dans un document, tous ces identifiants doivent être uniques.

    Facultatif. Permet de préciser la relation entre le document à partir duquel le lien a été réalisé et le document vers lequel le lien a été réalisé.

    Hypertext Markup Language (HTML) est un langage conçu spécifiquement pour la création de documents Web. Il définit la syntaxe et l'emplacement des instructions spéciales (balises) qui ne sont pas imprimées à l'écran mais indiquent au navigateur comment afficher le contenu du document. Il est également utilisé pour créer des liens vers d'autres documents, locaux ou en réseau, comme ceux trouvés sur Internet.

    Le standard HTML et d'autres standards pour le Web ont été développés sous la direction du W3C (World Wide Web Consortium). Les normes, spécifications et projets de nouvelles propositions peuvent être consultés sur http://www.3w.org/. La spécification HTML 4.0 est actuellement en vigueur et bénéficie d'un support croissant de la part des principaux navigateurs.

    En pratique, le standard HTML est fortement influencé par la présence de balises proposées et supportées par les navigateurs les plus connus, tels que Microsoft Internet Explorer et Netscape Navigator. Ces balises peuvent ou non faire actuellement partie de la spécification HTML actuelle.

    Informations sur les balises HTML Compendium (un guide rapide du HTML) créé par Ron Woodall. Le recueil contient une liste de balises et leurs attributs par ordre alphabétique, ainsi que des informations mises à jour sur la prise en charge des navigateurs pour chacune d'entre elles.

    Les documents HTML sont des fichiers texte ASCII classiques. Cela signifie que vous pouvez utiliser n'importe quel éditeur de texte pour les créer, même avec des capacités minimales. Il existe des outils d'édition spécialement conçus pour écrire du HTML. Ils permettent de gagner du temps en fournissant des touches de raccourci pour effectuer des tâches répétitives, telles que l'initialisation de documents, de tableaux ou simplement l'application de styles au texte. Les éditeurs HTML diffèrent des outils de création WYSIWYG (discutés ci-dessous) en ce sens qu'ils nécessitent la connaissance des règles de compilation manuelle du HTML ; les éditeurs ne font que simplifier et accélérer ce processus.

    Les utilisateurs de Windows devraient absolument consulter HomeSite, l'éditeur HTML puissant et peu coûteux d'Allaire Corporation. Il comprend la coloration syntaxique HTML, FTP, les vérifications de syntaxe et d'orthographe, ainsi que la recherche et le remplacement de plusieurs fichiers. De plus, il contient des commandes et des modèles spéciaux pour créer des éléments plus complexes (frames, scripts JavaScript et DHTML).

    Lorsque vous travaillez sur des ordinateurs Macintosh, faites attention à BBEdit, un éditeur HTML commercial de Bare Bones Software, Inc. Il a vraiment un certain poids parmi les développeurs Web Macintosh. Il comprend des outils HTML pratiques et rapides, une recherche et un remplacement multi-fichiers, une fonction FTP intégrée, la prise en charge de 13 langages de programmation, un générateur de tableaux, un contrôle de la syntaxe HTML et bien d'autres fonctionnalités.

    Ces dernières années ont été caractérisées par une forte croissance du marché des instruments originaux. Les éditeurs HTML WYSIWYG (What You See Is What You Get) disposent d'interfaces graphiques qui font que l'écriture HTML ressemble davantage à un programme d'édition de texte ou de mise en page. Le but initial de ces programmes était de libérer les utilisateurs des balises HTML, tout comme les programmes de balisage de page protègent le développeur du jeu de commandes PostScript. Aujourd'hui, leur importance s'est accrue à mesure qu'ils augmentent l'efficacité et le niveau d'automatisation de la production de documents, tout en donnant accès au texte source HTML.

    Les éditeurs WYSIWYG les plus populaires actuellement sont : Macromedia DreamWeaver, Golive CyberStudio (pour les ordinateurs Macintosh uniquement), Microsoft FrontPage, FileMaker Claris, Home Page, Adobe PageMill.

    Un document HTML contient du texte (le contenu de la page) et des balises en ligne : des instructions sur la structure, l'apparence et la fonction du contenu. Un document HTML est divisé en deux parties principales : l'en-tête et le corps. L'en-tête contient des informations sur le document, telles que son titre et des informations méthodologiques décrivant le contenu. Le corps contient le contenu du document lui-même (ce qui est affiché dans la fenêtre du navigateur).

    Chaque balise se compose d'un nom, qui peut être suivi d'une liste d'attributs facultatifs, tous contenus entre crochets angulaires.< >. Le contenu des parenthèses n'est jamais affiché dans la fenêtre du navigateur. Le nom de la balise est généralement une abréviation de sa fonction, ce qui facilite sa mémorisation. Les attributs sont des propriétés qui étendent ou affinent la fonction d'une balise. En règle générale, le nom et les attributs d'une balise ne sont pas sensibles à la casse. Étiqueter fonctionnera de la même manière que . Toutefois, les valeurs de certains attributs peuvent être sensibles à la casse. Cela s'applique en particulier aux noms de fichiers et aux URL.

    La plupart des balises sont des conteneurs. Cela signifie qu'ils ont une balise de début (ouverture ou début) et une balise de fin (fermeture). Le texte entre les balises exécutera les instructions qu'elles contiennent.

    La balise de fin porte le même nom que la balise de début, mais est précédée d'une barre oblique (/). Il peut être considéré comme un « commutateur » pour la balise. La balise de fin ne contient jamais d'attributs.

    Dans certains cas, la balise de fin est facultative et le navigateur détermine la fin de la balise à partir du contexte. La manière la plus courante d'omettre la balise de fin est<р>(paragraphe). Les navigateurs prenaient en charge cette balise sans la complétion correspondante, c'est pourquoi de nombreux rédacteurs Web se sont habitués à utiliser la forme courte. Toutes les balises ne le permettent pas et tous les navigateurs ne pardonnent pas leur absence. Alors en cas de doute, incluez une balise de fermeture dans votre texte. Ceci est particulièrement important lorsque vous utilisez des feuilles de style en cascade dans votre document.

    Certaines balises n'ont pas de balises de fin car elles sont utilisées pour placer des éléments individuels (autonomes) sur la page. L'un d'eux est la balise d'image , il place simplement les graphiques dans le flux des pages. Les autres balises autonomes sont les sauts de ligne (
    ), ligne horizontale (


    ) et des balises qui contiennent des informations sur le document et n'affectent pas le contenu affiché à l'écran, telles que Et .

    Des attributs sont ajoutés à une balise pour étendre ou modifier ses actions. Vous pouvez ajouter plusieurs attributs à une seule balise. Si les attributs de balise suivent le nom de la balise, ils sont séparés par un ou plusieurs espaces. L'ordre n'a pas d'importance. La plupart des attributs ont des valeurs qui suivent un signe égal (=) après le nom de l'attribut. Les valeurs sont limitées à 1024 caractères. Les valeurs peuvent être sensibles à la casse. Parfois, les valeurs doivent être entre guillemets (doubles ou simples). Les règles d'écriture des valeurs sont les suivantes :

    • - si la valeur est un seul mot ou un chiffre et se compose uniquement de lettres (a-z), de chiffres (0-9) et de caractères spéciaux (point<.>
    • - si la valeur contient plusieurs mots séparés par des virgules ou des espaces, ou contient des caractères spéciaux autres qu'un point ou un trait d'union, alors elle doit être placée entre guillemets. Par exemple, les URL nécessitent des guillemets car elles contiennent des caractères "://". Des guillemets sont également requis lors de la spécification des valeurs de couleur à l'aide du format "#rrggbb".

    Si vous n'êtes pas sûr d'utiliser des guillemets, utilisez-les toujours pour toutes les valeurs.

    Les balises HTML peuvent contenir d'autres balises HTML pour permettre à plusieurs balises d'affecter un seul élément. C'est ce qu'on appelle l'imbrication, et pour le faire correctement, les balises de début et de fin de la balise imbriquée doivent se trouver entre les balises de début et de fin de la balise externe.

    Une erreur courante consiste à superposer les balises. Bien que certains navigateurs affichent le contenu marqué de cette façon, beaucoup ne vous permettent pas d'enfreindre la règle, il est donc important de placer correctement les balises. L'exemple suivant montre une imbrication incorrecte des balises (notez que la balise<В>ferme avant de fermer ):

    Le temps est magnifique aujourd'hui - ces informations sont ignorées par les navigateurs.

    Informations ignorées par les navigateurs. Vous trouverez ci-dessous les informations contenues dans le document HTML, y compris certaines balises, qui seront ignorées lors de la visualisation par les navigateurs. Il comprend:

    • - les sauts de ligne. Les caractères de fin de ligne dans un document HTML sont ignorés. Le texte et les éléments seront renvoyés à la ligne jusqu'à ce que la balise soit rencontrée dans le flux du texte du document.
    • -caractères de tabulation et espaces multiples. Lorsque le navigateur rencontre un caractère de tabulation et plusieurs espaces consécutifs dans un document HTML, il n'affiche qu'un seul espace. Ainsi, si un document contient : « loin, très loin », le navigateur affichera « loin, très loin ». Des espaces supplémentaires peuvent être ajoutés à un flux de texte à l'aide du caractère espace insécable (Snbsp;). De plus, tous les espaces sont affichés si le texte est formaté (situé dans les balises
    • - plusieurs
    • - des balises non reconnues. Si le navigateur ne comprend pas la balise ou si elle a été mal définie, le navigateur l'ignore simplement. Selon la balise et le navigateur, cela peut produire des résultats différents. Soit le navigateur n'affichera rien, soit il affichera le contenu de la balise sous forme de texte brut ;
    • - texte dans les commentaires. Les navigateurs n'affichent pas de texte entre les éléments spéciaux

    Langage de balisage hypertexte (Html)

    Le World Wide Web, ou quelque chose de similaire au World Wide Web, WWW est le principal composant du réseau informatique mondial Internet. Né dans les années 60, Internet a longtemps été utilisé uniquement par un cercle restreint de spécialistes pour échanger des informations par courrier électronique. Le réseau était contrôlé par le système d'exploitation UNIX - cela convenait à des fins scientifiques, mais l'interface texte UNIX plutôt complexe limitait considérablement le champ d'application des technologies de réseau. L'année de naissance du World Wide Web est considérée comme 1989 - cette année où le langage a été inventé, qui est devenu plus tard le langage principal des documents Web - Ce langage est le HTML (HyperText Markup Language).

    L'auteur du langage HTML est Tim Berners-Lee, diplômé de l'Université d'Oxford, qui travaillait alors sous contrat à Genève, au Laboratoire européen de physique des particules (CERN, Conseil Européen pour la Recherche Nucléaire) en tant que consultant en logiciels. Le CERN est une organisation assez grande et, par conséquent, afin de mieux naviguer dans sa structure et de ne pas stocker en mémoire des données sur un grand nombre de projets, de responsables, etc., Tim Berners-Lee a développé le programme Inquire pour son usage personnel, sur le sur la base de laquelle, quelques années plus tard, une sorte d'espace d'information a été créé pour le laboratoire. Le programme Inquire permettait la recherche dite « non linéaire » de documents - c'est-à-dire passer d'un document à un autre sans consulter la table des matières ou l'ouvrage de référence.

    Le langage HTML constitue la base de la technologie hypertexte. Un document hypertexte contient ce qu'on appelle des hyperliens.

    Le langage de balisage de document est un ensemble d'instructions spéciales, appelées balises, conçues pour former une structure dans les documents et définir les relations entre les différents éléments de cette structure. Les balises de langue, ou balises de contrôle comme on les appelle parfois, sont en quelque sorte codées dans de tels documents, séparées du contenu principal du document et servent d'instructions au programme qui affiche le contenu du document côté client. Les premiers systèmes utilisaient les symboles «<” и “>», à l'intérieur duquel étaient placés les noms des instructions et leurs paramètres. Désormais, cette façon de désigner les balises est standard.

    L'utilisation de la décomposition hypertexte d'un document texte dans les systèmes d'information modernes est en grande partie due au fait que l'hypertexte vous permet de créer un mécanisme de visualisation non linéaire des informations. Dans de tels systèmes, les données ne sont pas présentées comme un flux continu d’informations textuelles, mais comme un ensemble de composants interconnectés, sur lesquels on peut naviguer à l’aide d’hyperliens.

    HTML n'est pas un langage de programmation en soi ; c'est un moyen de décrire la structure d'un document, son style et ses liens avec d'autres documents. Pour visualiser les documents Web, des programmes spéciaux sont utilisés - ce qu'on appelle des navigateurs (anglais : parcourir - 1) brouter, cueillir des pousses ; 2) lire, étudier au hasard, par à-coups.) En fait, les capacités des navigateurs sont beaucoup plus larges, mais pour l'instant nous nous limiterons à leur définition comme moyen de visualisation de documents Web. Internet doit sa popularité aux navigateurs.

    Hyper Text Markup Language (HTML) - un langage de balisage hypertexte - est destiné à la rédaction de documents hypertextes publiés sur le World Wide Web.

    Un document hypertexte est un fichier texte comportant des marques spéciales, appelées balises, qui sont ensuite reconnues par le navigateur et utilisées par celui-ci pour afficher le contenu du fichier sur l'écran de l'ordinateur.

    À l'aide de ces marques, vous pouvez mettre en évidence les titres des documents, modifier la couleur, la taille et le style des lettres et insérer des graphiques et des tableaux. Mais le principal avantage de l'hypertexte par rapport au texte ordinaire est la possibilité d'ajouter des hyperliens vers le contenu d'un document - des constructions spéciales du langage HTML qui vous permettent de cliquer sur une souris pour afficher un autre document.

    Document HTML se compose de deux parties : le texte lui-même, c'est-à-dire les données qui composent le contenu du document, et les balises - des constructions spéciales du langage HTML utilisées pour baliser le document et contrôler son affichage. Les balises du langage HTML déterminent sous quelle forme le texte sera présenté, lesquels de ses composants feront office de liens hypertextes et quels objets graphiques ou multimédias devront être inclus dans le document.

    Les informations graphiques et audio incluses dans un document HTML sont stockées dans des fichiers séparés. Visionneuses de documents HTML ( navigateurs) interpréter les indicateurs de balisage et organiser le texte et les graphiques à l'écran en conséquence. Pour les fichiers contenant des documents HTML, les extensions acceptées sont .htm ou .html.

    Dans la plupart des cas, les balises sont utilisées par paires. La paire se compose d'une ouverture<имя_тега>et fermetureMots clés L'effet de toute balise appariée commence là où la balise d'ouverture est rencontrée et se termine lorsque la balise de fermeture correspondante est rencontrée. Souvent, une paire composée d'une balise d'ouverture et d'une balise de fermeture est appelée récipient, et la partie du texte bordée par les balises d'ouverture et de fermeture est élément.

    La séquence de caractères qui constitue le texte peut être composée d'espaces, de tabulations, de nouvelles lignes, de retours chariot, de lettres, de signes de ponctuation, de chiffres et de caractères spéciaux (tels que #, +, $, @), à l'exception des quatre caractères suivants, qui ont In HTML, les significations spéciales sont (supérieur à), & (esperluette) et " (guillemet double). Si vous devez inclure l'un de ces caractères dans votre texte, vous devez l'encoder avec une séquence spéciale de caractères.

    Structure des documents HTML

    La balise HTML la plus importante est la balise du même nom. . Il ouvre toujours le document, tout comme une balise doit certainement apparaître dans sa dernière ligne. Ces balises indiquent que les lignes entre elles représentent un seul document hypertexte. Sans ces balises, un navigateur ou un autre visualiseur est incapable d'identifier le format du document et de l'interpréter correctement.

    Un document HTML se compose de deux parties : un en-tête et un corps, disposés dans l'ordre suivant :

    Titre du document Corps du document

    Le plus souvent, une balise appariée est incluse dans le titre du document ... , définissant le titre du document. De nombreux spectateurs l'utilisent comme titre de la fenêtre dans laquelle le document est affiché. Les programmes qui indexent des documents sur Internet utilisent le titre pour identifier la page. Un bon titre doit être suffisamment long pour identifier correctement la page correspondante, mais en même temps il doit tenir dans le titre de la fenêtre. Le titre du document s'insère entre les balises d'ouverture et de fermeture.

    Corps du document est un élément obligatoire, car il contient tout le matériel du document. Le corps du document est placé entre les balises Et

    . Tout ce qui est placé entre ces balises est interprété par le navigateur selon les règles du langage HTML, permettant à la page de s'afficher correctement sur l'écran du moniteur.

    Le texte en HTML est divisé en paragraphes à l'aide d'une balise<р>. Il est placé au début de chaque paragraphe et le spectateur, lorsqu'il le rencontre, sépare les paragraphes les uns des autres par une ligne vierge. Utiliser une balise de fermeturepas nécessaire.

    Si vous souhaitez « casser » le texte, en déplaçant le reste sur une nouvelle ligne, sans sélectionner de nouveau paragraphe, utilisez la balise de saut de ligne.
    . Il oblige le spectateur à afficher les caractères qui le suivent sur une nouvelle ligne. Contrairement à la balise paragraphe, la
    n'ajoute pas de ligne vide. Cette balise n'a pas de balise de fermeture appariée.

    Langage HTML pris en charge mise en forme logique et physique du contenu du document. Le formatage logique indique le but d'un morceau de texte donné, tandis que le formatage physique définit son apparence.

    En utilisant formatage logique texte, le navigateur sélectionne différentes parties du texte en fonction de la structure du document. Pour afficher le titre, l'une des balises de titre est utilisée. Les titres d'un document typique sont divisés en niveaux. HTML vous permet de définir six niveaux de titres : h1 (titre de premier niveau), h2, h3, h4, h5 et h6. Le titre du premier niveau est généralement plus grand et plus riche que le titre du deuxième niveau. Exemple d'utilisation des balises d'en-tête :

    l. Titre du chapitre

    ll. Section titre

    Mots clés formatage physique définir directement l'apparence du texte sur l'écran du navigateur, par exemple, quelques surlignements du texte en gras, définit le soulignement du texte, contrôle la police du texte.

    Étiqueter insère une image dans un document comme s'il s'agissait d'un simple grand caractère. Exemple d'utilisation d'une balise :

    Pour créer lien hypertexte quelques balises sont utilisées<а>... . Un morceau de texte, une image ou tout autre objet situé entre ces balises s'affiche dans la fenêtre du navigateur sous forme de lien hypertexte. L'activation d'un tel objet entraîne le chargement d'un nouveau document dans la fenêtre du navigateur ou l'affichage d'une autre partie de la page Web actuelle. Un lien hypertexte se forme à l'aide de l'expression :

    Href est ici un attribut obligatoire, dont la valeur est l'URL de la ressource demandée. Les guillemets spécifiant la valeur de l'attribut href sont facultatifs. Si un lien vers un document sur un autre serveur est spécifié, alors le type de lien hypertexte est le suivant :

    <а href = "http://www.school.donetsk.ua/11.jpg">Photo 11-A

    À l'aide de diverses balises, vous pouvez dessiner des tableaux, formater du texte, insérer des images, des vidéos, des fichiers audio, etc. dans un document.