"World Wide Web" (WWW). En quoi Internet diffère-t-il du World Wide Web ?

Communauté mondiale de réseaux ;
♦ qu'est-ce que le World Wide Web ?
♦ Serveur Web, page Web, site Web ;
♦ Hyperstructure WWW ;
♦ navigateur - programme client WWW ; problème de recherche d'informations sur Internet.

Internet est une communauté mondiale de réseaux

Souhaitez-vous visiter la résidence du président américain - la Maison Blanche, ou visiter le Louvre - le plus grand musée d'art du monde, ou découvrir quel temps il fait en Antarctique, ou obtenir des informations sur les représentations qui auront lieu ce soir dans les théâtres de Moscou ? Tout cela et bien plus peut être réalisé sans quitter la table sur laquelle est installé un ordinateur personnel, connecté au monde. réseaux L'Internet.

Internet rassemble des milliers de réseaux informatiques locaux, industriels et régionaux à travers le monde. Un utilisateur individuel qui n'est abonné à aucun des réseaux répertoriés peut également se connecter à Internet via le hub le plus proche.

Tous les services de réseau informatique ci-dessus ( E-mail, téléconférences, archives de fichiers, etc.) fonctionnent également sur Internet. Dans ce cas, seuls des problèmes de langage de communication peuvent survenir. La langue de communication internationale sur le World Wide Web est l’anglais. Voici une autre incitation pour vous à étudier assidûment langue anglaise !

Qu'est-ce que le World Wide Web

Le service le plus intéressant offert aux internautes depuis 1993 est la possibilité de travailler avec le système d'information du World Wide Web (en abrégé WWW). Cette expression peut être traduite par « World Wide Web ». Il s'agissait de travailler avec le WWW lorsqu'au début de ce paragraphe on vous proposait toutes sortes de miracles d'information.

Il est très difficile de donner une définition exacte de ce qu’est le WWW. Ce système peut être comparé à une immense encyclopédie dont les pages sont dispersées sur des serveurs informatiques connectés par Internet. Pour avoir le droit information, l'utilisateur doit accéder à la page de l'encyclopédie correspondante. C'est peut-être en gardant cette analogie à l'esprit que les créateurs du WWW ont introduit le concept de page Web.

Serveur Web, page Web, site Web

Une page Web est la principale unité d’information du WWW. Il s'agit d'un document distinct stocké sur un serveur Web. Une page a un nom (semblable à un numéro de page dans une encyclopédie) par lequel elle est accessible.

Les informations présentes sur une page Web peuvent être très différentes : texte, dessin, photographie, multimédia. Les pages Web contiennent également de la publicité, des informations de référence, des articles scientifiques, les dernières nouvelles, des publications illustrées, des catalogues d'art, des prévisions météorologiques et bien plus encore. Pour faire simple : les pages Web ont « tout ».

Un certain nombre de pages Web peuvent être liées thématiquement et former un site Web. Chaque site possède une page principale, appelée home (Home page). Il s'agit d'une sorte de page de titre, à partir de laquelle vous pouvez visualiser les documents stockés sur le serveur. En règle générale, la page d'accueil contient une table des matières - les noms des sections. Pour accéder à la section souhaitée, déplacez simplement le pointeur de la souris sur le nom de la section et cliquez sur le bouton souris.

Hyperstructure WWW

Cependant, il n'est pas du tout nécessaire de visualiser les pages Web d'affilée, en les feuilletant, comme dans un livre. La propriété la plus importante du WWW est l'organisation hypertexte des connexions entre les pages Web. De plus, ces connexions fonctionnent non seulement entre les pages d’un même serveur, mais également entre différents serveurs WWW.

En règle générale, les mots-clés liés par hyperlien sont mis en surbrillance ou soulignés sur une page Web. En cliquant sur un tel mot, vous suivrez un lien caché pour visualiser un autre document. De plus, ce document peut se trouver sur un autre serveur, dans un autre pays, sur un autre continent. Le plus souvent, l’internaute n’a aucune idée de l’endroit où se trouve le serveur avec lequel il communique actuellement. Au sens figuré, en une seule séance, vous pouvez « voler » plusieurs fois autour du globe.

Le rôle de clé de communication peut être joué non seulement par un texte, mais aussi par un dessin, une photographie ou un pointeur vers un document sonore. Dans ce cas, au lieu du terme « hypertexte », le terme « hypermédia » est utilisé.

Vous pouvez accéder à la même page Web de différentes manières. L’analogie avec les pages d’un livre ne fonctionne plus ici. Dans un livre, les pages ont un certain ordre. Les pages Web n'ont pas une telle séquence. Le passage d'une page à une autre s'effectue via des hyperliens, formant un réseau qui ressemble à un web. C'est de là que vient le nom du système.

En résumant ce qui précède, nous pouvons donner la définition suivante :

Le World Wide Web est un système d'information hyperconnecté distribué dans le monde entier, existant sur les bases techniques du World Wide Web.

Le navigateur est un programme client WWW. Le problème de la recherche d'informations sur Internet

L'utilisateur est aidé à naviguer sur le « Web » par un logiciel spécial appelé navigateur Web de l'anglais « browse » - « inspecter, étudier ». À l’aide d’un navigateur, vous pouvez trouver les informations dont vous avez besoin de différentes manières. Le chemin le plus court consiste à utiliser l’adresse de la page Web. Vous tapez cette adresse sur votre clavier, appuyez sur la touche Entrée et vous êtes directement redirigé vers l'emplacement.

Une autre façon est la recherche. Vous pouvez commencer à vous déplacer depuis votre page d'accueil via des hyperliens. Dans le même temps, il existe un risque de faire fausse route, de s’empêtrer dans la « toile » et de se retrouver dans une impasse. Cependant, le navigateur vous permet de revenir en arrière n'importe quel nombre d'étapes et de continuer la recherche sur un itinéraire différent. Une telle recherche s’apparente à une errance dans une forêt inconnue (bien que moins dangereuse).

Les programmes de recherche spéciaux sont de bons assistants pour naviguer sur le WWW. Ils « savent » tout ou presque tout sur le WWW. Un tel programme doit simplement spécifier un ensemble de mots-clés sur un sujet qui vous intéresse, et il fournira une liste de liens vers des documents Web appropriés. Si la liste s’avère trop longue, vous devez ajouter quelques termes plus clarifiants.

Lors des sessions Internet, un internaute semble immergé dans un espace d’information aux ressources illimitées. Récemment, le terme « cyberespace » s’est répandu, désignant l’ensemble des systèmes de télécommunications du monde et les informations qui y circulent.

Le système WWW se développe très rapidement. Déjà, toutes ses ressources sont difficiles à passer en revue. On publie des annuaires et des catalogues épais qui deviennent obsolètes plus rapidement que les annuaires téléphoniques. Par conséquent, parallèlement à l'augmentation du volume d'informations, le système de recherche sur le World Wide Web est amélioré.

En bref sur l'essentiel

Internet est un réseau informatique mondial.

World Wide Web - World Wide Web : système d'information hyperconnecté distribué dans le monde entier, existant sur la base technique de l'Internet mondial.

Une page Web est un document WWW distinct.

Le serveur Web est un ordinateur sur Internet qui stocke les pages Web et les logiciels correspondants pour les utiliser.

Un site Web est un ensemble de pages thématiquement liées.

L'hypermédia est un système de liens hypertextes entre des documents multimédias.

Le navigateur Web est un programme client permettant à l'utilisateur de travailler avec le WWW.

La recherche du document souhaité sur le WWW peut s'effectuer : en précisant son adresse ; en se déplaçant à travers un « réseau » d'hyperconnexions ; en utilisant des programmes de recherche.

Le cyberespace est l'ensemble des systèmes de télécommunications mondiaux et des informations qui y circulent.

Questions et tâches

1. Qu’est-ce qu’Internet ?
2. Comment l'expression « World Wide Web » est-elle traduite ?
3. Qu'est-ce que WWW ?
4. Quelles informations peuvent être obtenues sur le WWW ?
5. Comment s'organise la connexion entre les pages Web ?
6. Quelle est l’analogie entre le WWW et le Web ?
7. Qu'est-ce que l'hypermédia ?
8. Qu'est-ce qu'un serveur Web ?
9. Par quelles méthodes pouvez-vous trouver la page souhaitée sur le WWW ?

I. Semakin, L. Zalogova, S. Rusakov, L. Shestakova, Informatique, 9e année
Soumis par des lecteurs de sites Internet

Toute l'informatique en ligne, liste de sujets par sujet, recueil de notes sur l'informatique, devoirs, questions et réponses, résumés sur l'informatique 9e année, plans de cours

Contenu de la leçon notes de cours cadre de support présentation de cours méthodes d'accélération technologies interactives Pratique tâches et exercices ateliers d'autotest, formations, cas, quêtes devoirs questions de discussion questions rhétoriques des étudiants Illustrations audio, clips vidéo et multimédia photographies, images, graphiques, tableaux, diagrammes, humour, anecdotes, blagues, bandes dessinées, paraboles, dictons, mots croisés, citations Modules complémentaires résumés articles astuces pour les curieux crèches manuels scolaires dictionnaire de base et supplémentaire des termes autres Améliorer les manuels et les leçonscorriger les erreurs dans le manuel mise à jour d'un fragment dans un manuel, éléments d'innovation dans la leçon, remplacement des connaissances obsolètes par de nouvelles Uniquement pour les enseignants des leçons parfaites plan de calendrier pour l'année

Le progrès scientifique et technologique ne s'arrête pas, mais est en constante évolution, recherche et amélioration. L’invention la plus utile du génie humain, Internet, a peut-être été inventée relativement récemment, selon les normes du développement de la civilisation. À la base, il s’agit d’un outil d’échange de données unique.

Internet (Réseau, Internet) est un environnement virtuel qui garantit l'accès aux ressources d'information dont les éléments sont des ordinateurs personnels. Ils sont combinés en un seul circuit et dotés de fonctionnalités d'adressage uniques, utilisant des lignes de communication à haut débit avec les ordinateurs hôtes.

Internet est un immense réseau reliant d’innombrables appareils. Il sert à échanger des informations qui existent sur ce réseau sous diverses formes. De nos jours, les ordinateurs ne sont pas les seuls à pouvoir se connecter à Internet. Les téléphones mobiles, tablettes, consoles de jeux, autres gadgets et même les téléviseurs peuvent facilement accéder au réseau à tout moment.

L'importance de cet espace d'information est indéniable en raison des étonnantes capacités de communication entre les utilisateurs de tous les appareils connectés au réseau.

Techniquement, l’espace en ligne est constitué d’innombrables appareils informatiques connectés les uns aux autres. Des milliards d'utilisateurs de PC vivant dans différents pays communiquent entre eux chaque jour, transmettent et reçoivent des informations utiles, téléchargent des tableaux de données numériques sous forme d'applications, de programmes, d'utilitaires ; regarder des vidéos, écouter de la musique.

L'environnement en ligne possède une autre propriété importante : des possibilités illimitées de stockage d'informations. L'expérience personnelle est transmise via Internet ; c'est en outre une plate-forme unique d'information des masses pour les médias modernes et un référentiel colossal de connaissances mondiales.

Qu'est-ce que l'internet?

Afin que les propriétaires de PC vivant sur différents continents puissent utiliser librement les services de recherche de ressources réseau, des câbles principaux sont posés au fond de l'océan, à travers lesquels des informations utiles sont pompées 24 heures sur 24.

Un ordinateur personnel est contrôlé par des protocoles spéciaux. Il s'agit d'une sorte d'instruction qui vous permet de définir des règles de communication entre les appareils. Le seul critère de construction d’un protocole logiciel est l’adresse IP. Grâce à cette structure, chaque participant reçoit sa propre adresse numérique, à l'aide de laquelle s'effectuent la recherche et l'identification.

Par exemple, après avoir saisi le nom « novichkam.info » dans la ligne du navigateur, le client se retrouve en quelques instants sur une plateforme Web proposant une aide aux débutants. En termes techniques, le robot logiciel trouve simplement le code d'adresse IP attribué à un site spécifique.

L'algorithme de la machine comprend les opérations suivantes :

  1. la demande est enregistrée par le serveur principal, où est stocké le nom du tableau de données thématiques souhaité ;
  2. le nom de cette ressource se retrouve en mémoire, c'est-à-dire détecter l'adresse IP requise ;
  3. le client arrive sur le site Internet.

Il existe d'autres protocoles, comme HTTP. Les requêtes d'une autre manière sont effectuées avec l'ajout d'un préfixe http://

Qu'est-ce que le World Wide Web (WWW)

Pour la plupart des représentants du public cible, la définition d'un service Internet comme le World Wide Web en abréviation (WWW ou simplement WEB) présente un grand intérêt. Sa définition est un ensemble de pages Web interconnectées, dont l'accès est assuré par un nombre limité de PC connectés à Internet.

Un ensemble de fichiers texte balisés en HTML avec des liens, placés sur une plateforme électronique, est appelé un site Web. Vous pouvez vous familiariser avec le contenu d'un site Web particulier en activant le navigateur pour rechercher le nom de l'adresse.

Le Web se positionne aujourd'hui comme le service le plus recherché et le plus populaire dans l'espace en ligne, c'est-à-dire L'Internet. Un élément important du WEB sont les liens hypertextes. En cliquant sur le lien du document souhaité ou en demandant une URL unique (code de nom, chemin) dans le navigateur, une personne peut visualiser le tableau de texte souhaité.

Système d'adressage

Si vous saisissez un nom d'adresse incorrect dans la barre de recherche ou suivez un lien rompu, le navigateur signalera rapidement une erreur (confirmera l'absence de la page requise). Souvent, sur demande, une personne accède à un site publicitaire (frauduleux).

Dans cette situation, vous devez corriger l'inexactitude dans le champ de la chaîne de requête sans tenter d'enquêter sur le site Web publicitaire pour des raisons de sécurité. Le fait est que ces sites peuvent être infectés par un virus. Si la ressource a été créée dans un but frauduleux, il serait alors utile de vous familiariser avec notre section, où sont parfaitement décrites les méthodes de tromperie les plus populaires sur Internet.

L’élément principal de l’adresse de tout site Web est le domaine, ce qui facilite sa mémorisation. Le domaine affiche généralement l'adresse de la page d'accueil. Dans le même temps, il faut comprendre que pour le téléchargement technique d'une page, l'appareil informatique utilise IP avec le protocole "12.123.45.5". D'accord, cette combinaison est beaucoup plus difficile à retenir que le nom de domaine de notre site Internet.

Il est important de savoir que la saisie de « http:// » ou du préfixe « WWW » dans la barre de recherche n’est PAS nécessaire. Il est préférable d'utiliser les services d'un moteur de recherche, où l'erreur commise sera immédiatement corrigée et où le domaine pourra être saisi sans zone prêtant à confusion.

Que nous apporte Internet ?

  • communication et communication illimitées

De nombreuses personnes recherchent ici des personnes partageant les mêmes idées et communiquant sur des projets sociaux et des forums populaires. D'autres aiment le service unique de communication personnelle via ICQ ou Skype. Les visiteurs d’un site de rencontres s’attendent à trouver leur moitié ici ;

  • possibilités illimitées de divertissement et de loisirs personnels

Ici, vous pouvez écouter gratuitement des morceaux de musique populaires, profiter des derniers films des studios de cinéma, jouer à divers jeux, y compris les jeux d'argent, vous familiariser avec les œuvres d'auteurs modernes et les classiques du genre littéraire, répondre à des sondages, des tests, etc.

  • auto-éducation

Dans l'environnement de la communication de masse, vous pouvez non seulement lire des articles utiles, mais aussi participer à des formations, des master classes, regarder des cours vidéo ;

  • développement de la personnalité créative

Ici vous pourrez rencontrer des personnes rares, visiter leurs projets professionnels d'amélioration créative et personnelle ;

  • achat de biens et services

Les clients des supermarchés virtuels peuvent acheter des produits sans quitter leur domicile. En ligne, vous pouvez acheter des actions d'entreprises industrielles, commander des billets, réserver une chambre d'hôtel, etc. ;

  • de nouvelles façons de gagner de l'argent

Il existe plusieurs types de revenus sur Internet. Par exemple, vous pouvez ouvrir une boutique en ligne en créant votre propre blog (site Internet). Pour ceux qui débutent dans ce domaine, il est plus facile de commencer en freelance : rédiger des articles personnalisés, vendre des photos, proposer des services de création et de promotion de divers projets, faire de la conception et de la programmation Web.

  • beaucoup plus. Les informations sur notre site Web vous aideront à découvrir non seulement toutes les possibilités de ce réseau mondial, mais aussi à vivre une expérience formidable en y étant.

"World Wide Web" (WWW)

Le World Wide Web (WWW) est le service Internet le plus populaire et le plus intéressant, un moyen populaire et pratique de travailler avec l'information. Le nom le plus courant pour désigner un ordinateur sur Internet aujourd'hui est www ; plus de la moitié du flux de données Internet provient de WWW. Le nombre de serveurs WWW aujourd'hui ne peut pas être estimé avec précision, mais selon certaines estimations, il y en aurait plus de 30 millions. Le taux de croissance du WWW est encore plus élevé que celui d'Internet lui-même.

WWW est un référentiel d'informations mondial dans lequel les objets d'information sont liés par une structure hypertexte. L'hypertexte est avant tout un système de documents croisés, une manière de présenter des informations à l'aide de liens entre documents. Puisque le système WWW permet à ces documents d'inclure non seulement des textes, mais également des graphiques, du son et de la vidéo, un document hypertexte est devenu un document hypermédia.

Un peu d'histoire sur WWW. Le World Wide Web (WWW) est l'un des composants importants du World Wide Web. Et elle a sa propre histoire.

C'est intéressant. Le Laboratoire européen de physique des particules (CERN) est situé en Suisse. En 1980, un homme du nom de Tim Bernes-Lee, qui travaillait alors au CERN, a commencé à développer un projet de réseau informatique mondial qui permettrait aux physiciens du monde entier d'accéder à diverses informations. Cela a pris neuf ans. En 1989, après de nombreuses années d'expérimentations techniques, M. Tim a proposé une option spécifique, qui marquait le début du World Wide Web, ou WWW en abrégé.

Au fil du temps, beaucoup ont réalisé que ces services pouvaient être utilisés par différentes personnes, et pas seulement par les physiciens. WWW a commencé à se développer rapidement. De nombreuses personnes l'ont aidée dans cette tâche : certaines ont développé du matériel, d'autres ont créé des logiciels qui ont développé le WWW et d'autres encore ont amélioré les lignes de communication. Tout cela lui a permis de devenir ce qu'il est aujourd'hui : le « World Wide Web ».

Principes de fonctionnement client et serveur. WWW fonctionne sur le principe client-serveur, ou plus précisément client-serveur : il existe de nombreux serveurs qui, à la demande du client, lui renvoient un document hypermédia - un document constitué de parties avec une représentation diversifiée d'informations (texte, son , graphiques, objets tridimensionnels, etc.). ), dans lequel chaque élément peut être un lien vers un autre document ou une partie de celui-ci. Les liens dans les documents WWW sont organisés de telle manière que chaque ressource d'information sur l'Internet mondial est adressée de manière unique, et le document que vous lisez en ce moment est capable de créer des liens à la fois vers d'autres documents sur le même serveur et vers des documents (et dans général aux ressources Internet ) sur d'autres ordinateurs sur Internet. De plus, l'utilisateur ne s'en aperçoit pas et travaille avec l'ensemble de l'espace d'information d'Internet dans son ensemble.

Les liens WWW pointent non seulement vers des documents spécifiques au WWW lui-même, mais également vers d'autres services et ressources d'informations sur Internet. De plus, la plupart des programmes clients WWW (navigateurs, navigateurs) comprennent non seulement ces liens, mais sont également des programmes clients pour les services correspondants : FTP, Gopher, actualités du réseau Usenet, courrier électronique, etc. Ainsi, les outils logiciels WWW sont universels pour divers services Internet, et le système d'information WWW lui-même joue un rôle intégrateur.

Listons quelques termes utilisés sur le WWW.

Le premier terme - html - est un ensemble de séquences de contrôle de commandes contenues dans un document html et définissant les actions que le visualiseur (navigateur) doit effectuer lors du chargement de ce document. Cela signifie que chaque page est un fichier texte ordinaire contenant du texte visible par tout le monde et des instructions pour le programme invisibles pour les personnes sous la forme de liens vers d'autres pages, images, serveurs. Ainsi, des questionnaires et des fiches d'inscription sont remplis, et des enquêtes sociologiques sont réalisées.

Le deuxième terme est URL (Uniform Resource Locator - un pointeur universel vers une ressource). C'est ainsi qu'on appelle ces liens vers des ressources d'information sur Internet.

Un autre terme est http (protocole de transfert hypertexte). C'est le nom du protocole par lequel le client et le serveur WWW interagissent.

WWW est un service d'accès direct qui nécessite une connexion Internet complète et, en outre, nécessite souvent des lignes de communication rapides si les documents que vous lisez contiennent de nombreux graphiques ou d'autres informations non textuelles.

Le développement rapide d’Internet, amorcé au début des années 90, est en grande partie dû à l’émergence de nouvelles technologies sur le Web. Cette technologie repose sur la technologie hypertexte, qui a été étendue à tous les ordinateurs connectés à Internet.

Lors de l'utilisation de la technologie hypertexte, le texte est structuré et les mots-liens y sont mis en évidence. Lorsqu'un lien est activé (par exemple à l'aide de la souris), une transition se produit vers le fragment de texte spécifié dans le lien ou vers un autre document. Ainsi, nous pourrions convertir notre texte en hypertexte en mettant en évidence les mots « technologie hypertexte » dans le premier paragraphe et en notant que lorsque ce lien est activé, une transition se produira au début du deuxième paragraphe.

La technologie WWW vous permet de naviguer non seulement dans le document source, mais également vers n'importe quel document situé sur un ordinateur donné et, surtout, vers n'importe quel document sur n'importe quel ordinateur actuellement connecté à Internet. Les documents mis en œuvre à l'aide de la technologie WWW sont appelés pages Web.

La structuration des documents et la création de pages Web s'effectuent à l'aide de HTML (Hyper Text Markup Language). L'éditeur de texte Word vous permet d'enregistrer des documents au format page Web. Les pages Web sont visualisées à l'aide de programmes de visualisation de navigateur spéciaux. Actuellement, les navigateurs les plus courants sont Internet Explorer, Netscape Navigator, Opera.

Si votre ordinateur est connecté à Internet, vous pouvez télécharger l'un des navigateurs et partir en voyage sur le World Wide Web. Tout d'abord, vous devez télécharger une page Web à partir de l'un des serveurs Internet, puis rechercher le lien et l'activer. En conséquence, une page Web sera chargée à partir d'un autre serveur Internet, qui peut être situé dans une autre partie du monde. À votre tour, vous pouvez activer le lien sur cette page Web, la page Web suivante se chargera, etc.

Internet se développe à un rythme très rapide et il devient de plus en plus difficile de trouver les informations nécessaires parmi des dizaines de millions de documents. Pour rechercher des informations, des serveurs de recherche spéciaux sont utilisés, qui contiennent des informations précises et constamment mises à jour sur le contenu de dizaines de millions de pages Web.

Histoire de la création et du développement d'Internet.

Internet doit ses origines au Département américain de la Défense et à ses recherches secrètes menées en 1969 pour tester des méthodes permettant aux réseaux informatiques de survivre aux opérations militaires en redirigeant dynamiquement les messages. Le premier réseau de ce type était ARPAnet, qui combinait trois réseaux en Californie avec un réseau en Utah selon un ensemble de règles appelées protocole Internet (IP en abrégé).

En 1972, l'accès a été ouvert aux universités et aux organismes de recherche, à la suite de quoi le réseau a commencé à fédérer 50 universités et organismes de recherche ayant des contrats avec le ministère américain de la Défense.

En 1973, le réseau prend une dimension internationale, combinant des réseaux situés en Angleterre et en Norvège. Une décennie plus tard, l'IP a été étendu pour inclure un ensemble de protocoles de communication prenant en charge les réseaux locaux et étendus. C'est ainsi qu'est né TCP/IP. Peu de temps après, la National Science Foundation (NSF) a lancé NSFnet dans le but de relier 5 centres de calcul intensif. Parallèlement à l'introduction du protocole TCP/IP, le nouveau réseau a rapidement remplacé ARPAnet comme épine dorsale d'Internet.

Eh bien, comment Internet est-il devenu si populaire et développé, et l'impulsion pour cela, ainsi que pour en faire un environnement propice aux affaires, a été donnée par l'émergence du World Wide Web (World Wide Web, WWW, 3W, ve-ve-ve, trois doubles) - systèmes hypertextes, qui ont rendu la navigation sur Internet rapide et intuitive.

Mais l'idée de relier des documents via hypertexte a été proposée et promue pour la première fois par Ted Nelson dans les années 1960, mais le niveau de technologie informatique existant à cette époque ne permettait pas de lui donner vie, même si qui sait comment cela se serait terminé. si Cette idée a-t-elle trouvé une application ?!

Les bases de ce que nous entendons aujourd'hui par le WWW ont été posées dans les années 1980 par Tim Berners-Lee alors qu'il travaillait sur un système hypertexte au Laboratoire européen de physique des particules (Centre européen de recherche nucléaire).

À la suite de ces travaux, en 1990, la communauté scientifique a reçu le premier navigateur de texte (browser), qui permet de visualiser en ligne des fichiers texte liés par des hyperliens. Le navigateur a été mis à la disposition du grand public en 1991, mais son adoption en dehors du monde universitaire a été lente.

Une nouvelle étape historique dans le développement d'Internet est due à la sortie de la première version Unix du navigateur graphique Mosaic en 1993, développé en 1992 par Marc Andreessen, étudiant stagiaire au National Center for Supercomputing Applications (NCSA), ETATS-UNIS.

Depuis 1994, après la sortie des versions du navigateur Mosaic pour les systèmes d'exploitation Windows et Macintosh, et peu après - les navigateurs Netscape Navigator et Microsoft Internet Explorer, la popularité explosive du WWW et, en conséquence, Internet a débuté auprès du grand public, d'abord aux États-Unis, puis dans le monde entier.

En 1995, la NSF a transféré la responsabilité d'Internet au secteur privé et depuis lors, Internet existe tel que nous le connaissons aujourd'hui.


Services Internet.

Les services sont des types de services fournis par des serveurs Internet.
Dans l'histoire d'Internet, il existe différents types de services, dont certains ne sont plus utilisés, d'autres perdent progressivement de leur popularité, tandis que d'autres connaissent leur apogée.
Nous listons les services qui n'ont pas perdu de leur pertinence pour le moment :
-World Wide Web - le World Wide Web - un service de recherche et de visualisation de documents hypertextes, notamment graphiques, sonores et vidéo. -E-mail – courrier électronique – service de transmission de messages électroniques.
-Usenet, News – téléconférences, groupes de discussion – un type de journal ou de babillard en ligne.
-FTP – service de transfert de fichiers.
-ICQ est un service de communication en temps réel à l'aide d'un clavier.
-Telnet est un service d'accès à distance aux ordinateurs.
-Gopher – service d'accès aux informations à l'aide de répertoires hiérarchiques.

Parmi ces services, nous pouvons souligner les services conçus pour la communication, c'est-à-dire pour la communication, le transfert d'informations (E-mail, ICQ), ainsi que les services dont le but est de stocker des informations et de donner accès à ces informations aux utilisateurs.

Parmi les services les plus récents, la première place en termes de volume d'informations stockées est occupée par le service WWW, car ce service est le plus pratique pour les utilisateurs et le plus avancé en termes techniques. En deuxième lieu se trouve le service FTP, puisque quelles que soient les interfaces et les commodités développées pour l'utilisateur, les informations sont toujours stockées dans des fichiers dont l'accès est assuré par ce service. Les services Gopher et Telnet peuvent actuellement être considérés comme « en train de mourir », puisque presque aucune nouvelle information n'est reçue sur les serveurs de ces services et que le nombre de ces serveurs et leur audience n'augmentent pratiquement pas.

World Wide Web - World Wide Web

Le World Wide Web (WWW) est un système d'information hypertexte, ou plus précisément hypermédia, permettant de rechercher des ressources Internet et d'y accéder.

L'hypertexte est une structure d'information qui vous permet d'établir des connexions sémantiques entre des éléments de texte sur un écran d'ordinateur de telle manière que vous puissiez facilement passer d'un élément à un autre.
En pratique, en hypertexte, certains mots sont mis en valeur en les soulignant ou en les colorant d'une couleur différente. La mise en surbrillance d'un mot indique qu'il existe un lien entre ce mot et un document dans lequel le sujet associé au mot en surbrillance est discuté plus en détail.

L'hypermédia, c'est ce qui se passe si vous remplacez le mot « texte » dans la définition de l'hypertexte par « tout type d'information » : son, graphique, vidéo.
De tels liens hypermédia sont possibles car, à côté des informations textuelles, il est possible de relier toute autre information binaire, par exemple du son codé ou des graphiques. Ainsi, si un programme affiche une carte du monde et si l'utilisateur sélectionne un continent sur cette carte à l'aide de la souris, le programme peut fournir des informations graphiques, audio et textuelles à ce sujet.

Le système WWW est construit sur un protocole de transfert de données spécial appelé HyperText Transfer Protocol (HTTP).
Tout le contenu du système WWW se compose de pages WWW.

Les pages WWW sont des documents hypermédias du système World Wide Web. Ils sont créés à l'aide du langage de balisage hypertexte HTML (Hypertext markup Language). Une page WWW est en fait généralement un ensemble de documents hypermédias situés sur un serveur, entrelacés de liens mutuels et liés dans leur signification (par exemple, contenant des informations sur un établissement d'enseignement ou un musée). Chaque page du document, à son tour, peut contenir plusieurs pages d'écran de texte et d'illustrations. Chaque page WWW possède sa propre « page de titre » (en anglais : « homepage ») - un document hypermédia contenant des liens vers les principaux composants de la page. Les adresses « page de titre » sont diffusées sur Internet sous forme d'adresses de page.

Un ensemble de pages Web interconnectées par des liens et conçues pour atteindre un objectif commun est appelé un site Web.

E-mail.

Le courrier électronique est apparu il y a environ 30 ans. Il s’agit aujourd’hui du moyen d’échange d’informations le plus répandu sur Internet. La possibilité de recevoir et d'envoyer des e-mails peut être utile non seulement pour communiquer avec des amis d'autres villes et pays, mais également dans le cadre d'une carrière commerciale. Par exemple, lorsque vous postulez à un emploi, vous pouvez envoyer rapidement votre CV par courrier électronique à diverses entreprises. De plus, sur de nombreux sites où vous devez vous inscrire (jeux en ligne, boutiques en ligne, etc.), vous devez souvent fournir votre e-mail. En un mot, le courrier électronique est une chose très utile et pratique.

Le courrier électronique (courrier électronique, courrier anglais - courrier, courrier électronique abrégé) est utilisé pour transmettre des messages texte sur Internet, ainsi qu'entre d'autres réseaux de messagerie. (Image 1.)

Grâce au courrier électronique, vous pouvez envoyer des messages, les recevoir dans votre boîte de réception électronique, répondre aux lettres des correspondants, envoyer des copies de lettres à plusieurs destinataires à la fois, transférer une lettre reçue vers une autre adresse, utiliser des noms logiques au lieu d'adresses, créer plusieurs sous-sections de boîte aux lettres pour différents types correspondance, incluent dans les lettres divers fichiers sonores et graphiques, ainsi que des fichiers binaires - programmes.

Pour utiliser le courrier électronique, l'ordinateur doit être connecté au réseau téléphonique via un modem.
Un ordinateur connecté à un réseau est considéré comme un expéditeur et un récepteur potentiel de paquets. Chaque nœud Internet, lorsqu'il envoie un message à un autre nœud, le divise en paquets de longueur fixe, généralement de 1 500 octets. Chaque paquet est doté d'une adresse de destinataire et d'une adresse d'expéditeur. Les paquets ainsi préparés sont envoyés via des canaux de communication vers d'autres nœuds. Lors de la réception d'un paquet, le nœud analyse l'adresse du destinataire et, si elle correspond à sa propre adresse, le paquet est accepté, sinon il est envoyé davantage. Les paquets reçus liés au même message sont accumulés. Une fois que tous les paquets d'un message sont reçus, ils sont concaténés et remis au destinataire. Des copies des paquets sont stockées sur les nœuds d'envoi jusqu'à ce qu'une réponse soit reçue du nœud destinataire indiquant la livraison réussie du message. Cela garantit la fiabilité. Pour remettre une lettre au destinataire, il suffit de connaître son adresse et les coordonnées de la boîte aux lettres la plus proche. Sur le chemin du destinataire, la lettre passe par plusieurs bureaux de poste (nœuds).

Service FTP

Le service Internet FTP (file transfer protocol) signifie protocole
transfert de fichiers, mais lorsque l'on considère FTP comme service Internet, il existe
pas seulement un protocole, mais un service - accès aux fichiers dans un fichier
les archives.

Dans les systèmes UNIX, FTP est un programme standard qui s'exécute sur le protocole TCP,
toujours fourni avec le système d'exploitation. Son objectif initial est
transférer des fichiers entre différents ordinateurs fonctionnant sur des réseaux TCP/IP : activé
Sur l'un des ordinateurs, le programme serveur est en cours d'exécution, sur le second, l'utilisateur exécute
un programme client qui se connecte au serveur et envoie ou reçoit
Fichiers FTP (Figure 2)

Figure 2. Diagramme du protocole FTP

Le protocole FTP est optimisé pour le transfert de fichiers. Par conséquent, les programmes FTP sont devenus
partie d'un service Internet distinct. Le serveur FTP peut être configuré comme ceci
manière que vous puissiez vous connecter avec lui non seulement sous un nom spécifique, mais également sous
nom conditionnel anonyme - personne anonyme. Dans ce cas, toutes les informations ne sont pas accessibles au client.
système de fichiers de l'ordinateur, mais un ensemble de fichiers sur le serveur qui
compose le contenu d'un serveur FTP anonyme - une archive de fichiers publics.

Aujourd'hui, les archives de fichiers publics sont organisées principalement sous forme de serveurs
FTP anonyme. Une énorme quantité d’informations est aujourd’hui disponible sur ces serveurs.
et logiciels. Presque tout ce qui peut être fourni
au public sous forme de fichiers, accessibles depuis des serveurs FTP anonymes. Ce sont des programmes -
versions freeware, démo et multimédia, c'est enfin
juste des textes – des lois, des livres, des articles, des rapports.

Malgré sa popularité, FTP présente de nombreux inconvénients. Programmes-
Les clients FTP ne sont pas toujours pratiques ou faciles à utiliser. Ce n'est pas toujours possible
comprenez quel type de fichier vous avez devant vous - que ce soit le fichier que vous recherchez ou non. Non
un outil de recherche simple et universel pour les serveurs FTP anonymes - bien que pour
C’est pourquoi il existe des programmes et services spéciaux, mais ils ne fournissent pas toujours
les résultats souhaités.

Les serveurs FTP peuvent également donner accès aux fichiers sous un mot de passe - par exemple,
à vos clients.

Service TELNET

Le but du protocole TELNET est de fournir un moyen de communication assez général, bidirectionnel et orienté octet sur huit bits. Son objectif principal est de permettre aux terminaux et aux processus terminaux de communiquer entre eux. Il est prévu que ce protocole puisse être utilisé pour la communication de terminal à terminal (« regroupement ») ou pour la communication de processus à processus (« informatique distribuée »).

Figure 3. Fenêtre du terminal Telnet

Bien qu'une session Telnet ait un côté client et un côté serveur, le protocole est en réalité complètement symétrique. Après avoir établi une connexion de transport (généralement TCP), ses deux extrémités jouent le rôle de « terminaux virtuels réseau » (anglais). Terminal virtuel réseau, NVT) échangeant deux types de données :

Données d'application (c'est-à-dire les données qui vont de l'utilisateur à l'application de texte côté serveur et inversement) ;

Commandes du protocole Telnet, dont un cas particulier sont les options qui servent à comprendre les capacités et les préférences des parties (Figure 3).

Bien qu'une session Telnet exécutée sur TCP soit en duplex intégral, le NVT doit être considéré comme un périphérique semi-duplex qui fonctionne par défaut en mode tampon de ligne.

Les données de l'application transitent par le protocole sans modification, c'est-à-dire qu'à la sortie du deuxième terminal virtuel, nous voyons exactement ce qui a été saisi à l'entrée du premier. D'un point de vue protocolaire, les données sont simplement une séquence d'octets (octets), qui appartiennent par défaut au jeu ASCII, mais lorsque l'option est activée Binaire- n'importe lequel. Bien que des extensions aient été proposées pour identifier un jeu de caractères, elles ne sont pas utilisées en pratique.

Toutes les valeurs d'octets de données d'application à l'exception de \377 (décimal : 255) sont transmises telles quelles sur le transport. L'octet \377 est transmis sous la forme d'une séquence \377\377 de deux octets. En effet, l'octet \377 est utilisé au niveau de la couche transport pour coder les options.

Le protocole fournit des fonctionnalités minimales par défaut et un ensemble d'options qui l'étendent. Le principe des options négociées exige que des négociations aient lieu lorsque chaque option est incluse. Une partie initie la demande et l’autre partie peut accepter ou rejeter l’offre. Si la demande est acceptée, l'option prend effet immédiatement. Les options sont décrites séparément du protocole lui-même et leur prise en charge par logiciel est facultative. Le client de protocole (terminal réseau) est invité à rejeter les demandes d'activation d'options non prises en charge et inconnues.

Historiquement, Telnet était utilisé pour accéder à distance à l'interface de ligne de commande des systèmes d'exploitation. Par la suite, il a commencé à être utilisé pour d’autres interfaces texte, notamment les jeux MUD. Théoriquement, même les deux côtés du protocole peuvent être non seulement des personnes, mais aussi des programmes.

Parfois, les clients telnet sont utilisés pour accéder à d'autres protocoles basés sur le transport TCP, voir Telnet et autres protocoles.

Le protocole telnet est utilisé dans la connexion de contrôle FTP, c'est-à-dire que la connexion Telnet au serveur avec la commande telnet ftp.example.net ftp pour effectuer le débogage et l'expérimentation est non seulement possible, mais également correcte (contrairement à l'utilisation de clients telnet pour accéder à HTTP, IRC et la plupart des autres protocoles).

Le protocole ne prévoit l'utilisation ni du cryptage ni de l'authentification des données. Il est donc vulnérable à tout type d’attaque auquel son transport, c’est-à-dire le protocole TCP, est vulnérable. Pour la fonctionnalité d'accès à distance au système, on utilise actuellement le protocole réseau SSH (notamment sa version 2), lors de la création duquel l'accent a été mis spécifiquement sur les questions de sécurité. Gardez donc à l’esprit qu’une session Telnet est très peu sécurisée à moins qu’elle ne soit effectuée sur un réseau entièrement contrôlé ou avec une sécurité au niveau du réseau (diverses implémentations VPN). En raison du manque de fiabilité, Telnet comme moyen de gestion des systèmes d'exploitation a longtemps été abandonné.


Informations connexes.


World Wide Web (en abrégé World Wide Web ou WWW) est une unité de ressources d'information interconnectées au moyen de télécommunications et basées sur une représentation hypertexte de données dispersées à travers le monde.

L’année de naissance du World Wide Web est considérée comme 1989. C'est cette année-là que Tim Berners-Lee a proposé un projet hypertexte commun, qui deviendra plus tard connu sous le nom de World Wide Web.

Le créateur du « web » Tim Bernes-Lee, travaillant au laboratoire de physique des particules élémentaires du Centre européen de recherche nucléaire « CERN » à Genève (Suisse), en collaboration avec son partenaire Robert Caillot, a travaillé sur les problèmes d'application des idées hypertextes construire un environnement d'information qui simplifierait l'échange d'informations entre physiciens.

Le résultat de ce travail a été un document qui examine les concepts fondamentaux du « web » dans sa forme moderne et propose les URI, le protocole HTTP et le langage HTML. Sans ces technologies, il n’est plus possible d’imaginer l’Internet moderne.

Berners-Lee a créé le premier serveur Web au monde et le premier navigateur Web hypertexte au monde. Sur le premier site Web au monde, il a décrit ce qu'était le World Wide Web et comment configurer un serveur Web, comment utiliser un navigateur, etc. Ce site était également le premier catalogue Internet au monde.

Depuis 1994, les tâches les plus importantes pour le développement du World Wide Web ont été reprises par le World Wide Web Consortium ( Consortium du World Wide Web, WZS), organisé et toujours dirigé par Kim Bernes-Lee. Le consortium développe et met en œuvre des normes technologiques pour Internet et le World Wide Web. Mission WZS : « Libérez tout le potentiel du World Wide Web en créant des protocoles et des principes qui garantissent le développement à long terme du réseau. » WZS développe des « recommandations » pour assurer la compatibilité entre les produits logiciels et les équipements de diverses entreprises, ce qui rend le World Wide Web plus avancé, universel et pratique.

Moteurs de recherche : composition, fonctions, principes de fonctionnement.

Système de recherche est un complexe logiciel et matériel conçu pour effectuer des recherches sur Internet et répondre à une demande d'utilisateur, spécifiée sous la forme d'une phrase textuelle (requête de recherche), en produisant une liste de liens vers des sources d'information, par ordre de pertinence (conformément à la demande). Les plus grands moteurs de recherche internationaux : "Google", "Yahoo", "MSN". Sur Internet russe, c'est - "Yandex", "Randonneur", "Un port".

Décrivons principales caractéristiques des moteurs de recherche :

    exhaustivité

L'exhaustivité est l'une des principales caractéristiques d'un système de recherche, qui est le rapport entre le nombre de documents trouvés par requête et le nombre total de documents sur Internet qui satisfont à la requête donnée. Par exemple, s'il y a 100 pages sur Internet contenant l'expression « comment choisir une voiture » et que seulement 60 d'entre elles ont été trouvées pour la requête correspondante, alors l'exhaustivité de la recherche sera de 0,6. Évidemment, plus la recherche est complète, moins il est probable que l'utilisateur ne trouve pas le document dont il a besoin, à condition qu'il existe sur Internet.

    Précision

La précision est une autre caractéristique principale d'un moteur de recherche, qui est déterminée par le degré avec lequel les documents trouvés correspondent à la requête de l'utilisateur. Par exemple, si la requête « comment choisir une voiture » contient 100 documents, 50 d'entre eux contiennent l'expression « comment choisir une voiture », et le reste contient simplement ces mots (« comment choisir la bonne radio et l'installer dans une voiture »), alors la précision de la recherche est considérée comme égale à 50/100 (=0,5). Plus la recherche est précise, plus l'utilisateur trouvera rapidement les documents dont il a besoin, moins il y aura de « déchets » divers parmi eux, moins souvent les documents trouvés ne correspondront pas à la demande.

    Pertinence

La pertinence est un élément tout aussi important de la recherche, qui se caractérise par le temps qui s'écoule entre le moment où les documents sont publiés sur Internet jusqu'à leur saisie dans la base de données d'index du moteur de recherche. Par exemple, le lendemain de l’apparition d’une nouvelle intéressante, un grand nombre d’utilisateurs se sont tournés vers les moteurs de recherche avec des requêtes pertinentes. Objectivement, moins d'un jour s'est écoulé depuis la publication d'informations d'actualité sur ce sujet, mais les principaux documents ont déjà été indexés et disponibles pour la recherche, grâce à l'existence de la « base de données rapide » des grands moteurs de recherche, qui est mis à jour plusieurs fois par jour.

    Vitesse de recherche

La vitesse de recherche est étroitement liée à sa résistance à la charge. Par exemple, selon Rambler Internet Holding LLC, aujourd'hui, pendant les heures de bureau, le moteur de recherche Rambler reçoit environ 60 requêtes par seconde. Une telle charge de travail nécessite de réduire le temps de traitement d'une demande individuelle. Ici, les intérêts de l'utilisateur et du moteur de recherche coïncident : le visiteur souhaite obtenir des résultats le plus rapidement possible, et le moteur de recherche doit traiter la demande le plus rapidement possible, afin de ne pas ralentir le calcul des requêtes ultérieures.

    Visibilité

La présentation visuelle des résultats est un élément important d’une recherche pratique. Pour la plupart des requêtes, le moteur de recherche trouve des centaines, voire des milliers de documents. En raison de requêtes peu claires ou de recherches inexactes, même les premières pages de résultats de recherche ne contiennent pas toujours uniquement les informations nécessaires. Cela signifie que l'utilisateur doit souvent effectuer sa propre recherche dans la liste des résultats trouvés. Divers éléments de la page de résultats du moteur de recherche vous aident à naviguer dans les résultats de recherche. Des explications détaillées sur la page de résultats de recherche, par exemple pour Yandex, peuvent être trouvées sur le lien http://help.yandex.ru/search/?id=481937.

Un bref historique du développement des moteurs de recherche

Au cours de la période initiale de développement d’Internet, le nombre d’utilisateurs était faible et la quantité d’informations disponibles relativement faible. Pour la plupart, seul le personnel de recherche avait accès à Internet. À cette époque, la tâche de recherche d’informations sur Internet n’était pas aussi urgente qu’aujourd’hui.

L'un des premiers moyens d'organiser l'accès aux ressources d'information du réseau a été la création d'annuaires ouverts de sites, dans lesquels des liens vers des ressources étaient regroupés par thème. Le premier projet de ce type était le site Web Yahoo.com, ouvert au printemps 1994. Après que le nombre de sites dans l'annuaire Yahoo ait considérablement augmenté, la possibilité de rechercher les informations nécessaires dans l'annuaire a été ajoutée. Au sens plein, il ne s'agissait pas encore d'un moteur de recherche, puisque la zone de recherche se limitait aux seules ressources présentes dans le catalogue, et non à toutes les ressources Internet.

Les répertoires de liens étaient largement utilisés dans le passé, mais ils ont presque complètement perdu de leur popularité à l'heure actuelle. Étant donné que même les catalogues modernes, au volume énorme, ne contiennent des informations que sur une partie négligeable d'Internet. Le plus grand répertoire du réseau DMOZ (également appelé Open Directory Project) contient des informations sur 5 millions de ressources, tandis que la base de données du moteur de recherche Google comprend plus de 8 milliards de documents.

Le premier moteur de recherche à part entière fut le projet WebCrawler, publié en 1994.

En 1995, apparaissent les moteurs de recherche Lycos et AltaVista. Ce dernier est leader dans le domaine de la recherche d’informations sur Internet depuis de nombreuses années.

En 1997, Sergey Brin et Larry Page ont créé le moteur de recherche Google dans le cadre d'un projet de recherche à l'Université de Stanford. Google est actuellement le moteur de recherche le plus populaire au monde !

En septembre 1997, le moteur de recherche Yandex, le plus populaire sur Internet en langue russe, a été officiellement annoncé.

Actuellement, il existe trois principaux moteurs de recherche internationaux : Google, Yahoo et MSN, qui disposent de leurs propres bases de données et algorithmes de recherche. La plupart des autres moteurs de recherche (qui sont très nombreux) utilisent sous une forme ou une autre les résultats des trois répertoriés. Par exemple, la recherche AOL (search.aol.com) utilise la base de données Google, tandis qu'AltaVista, Lycos et AllTheWeb utilisent la base de données Yahoo.

Composition et principes de fonctionnement du système de recherche

En Russie, le principal moteur de recherche est Yandex, suivi de Rambler.ru, Google.ru, Aport.ru, Mail.ru. De plus, Mail.ru utilise actuellement le moteur de recherche et la base de données Yandex.

Presque tous les principaux moteurs de recherche ont leur propre structure, différente des autres. Il est cependant possible d’identifier les principales composantes communes à tous les moteurs de recherche. Les différences de structure ne peuvent prendre la forme que de la mise en œuvre des mécanismes d'interaction de ces composants.

Module d'indexation

Le module d'indexation se compose de trois programmes auxiliaires (robots) :

Araignée – un programme conçu pour télécharger des pages Web. L'araignée télécharge la page et récupère tous les liens internes de cette page. Le code html de chaque page est téléchargé. Les robots utilisent les protocoles HTTP pour télécharger des pages. L'araignée fonctionne comme suit. Le robot envoie la requête « get/path/document » et quelques autres commandes de requête HTTP au serveur. En réponse, le robot reçoit un flux de texte contenant des informations sur le service et le document lui-même.

    L'URL de la page

    date à laquelle la page a été téléchargée

    En-tête http de réponse du serveur

    corps de la page (code html)

Crawler (araignée « voyageuse ») – un programme qui suit automatiquement tous les liens trouvés sur la page. Sélectionne tous les liens présents sur la page. Son travail consiste à déterminer où l'araignée doit aller ensuite, sur la base de liens ou d'une liste d'adresses prédéterminée. Crawler, en suivant les liens trouvés, recherche de nouveaux documents encore inconnus du moteur de recherche.

Indexeur (indexeur de robot) - un programme qui analyse les pages Web téléchargées par les araignées. L'indexeur analyse la page en ses composants et les analyse à l'aide de ses propres algorithmes lexicaux et morphologiques. Divers éléments de la page sont analysés, tels que le texte, les titres, les liens, les caractéristiques structurelles et stylistiques, les balises HTML de services spéciaux, etc.

Ainsi, le module d'indexation permet d'explorer un ensemble donné de ressources à l'aide de liens, de télécharger les pages rencontrées, d'extraire des liens vers de nouvelles pages à partir des documents reçus et d'effectuer une analyse complète de ces documents.

Base de données

Une base de données, ou index d'un moteur de recherche, est un système de stockage de données, un tableau d'informations dans lequel sont stockés les paramètres spécialement convertis de tous les documents téléchargés et traités par le module d'indexation.

Serveur de recherche

Le serveur de recherche est l'élément le plus important de l'ensemble du système, puisque la qualité et la rapidité de la recherche dépendent directement des algorithmes qui sous-tendent son fonctionnement.

Le serveur de recherche fonctionne comme suit :

    La demande reçue de l'utilisateur est soumise à une analyse morphologique. L'environnement informationnel de chaque document contenu dans la base de données est généré (qui sera ensuite affiché sous la forme d'un extrait, c'est-à-dire d'informations textuelles correspondant à la requête sur la page des résultats de recherche).

    Les données reçues sont transmises comme paramètres d'entrée à un module de classement spécial. Les données sont traitées pour tous les documents, de sorte que chaque document dispose de sa propre notation qui caractérise la pertinence de la requête saisie par l'utilisateur et les différents éléments de ce document stockés dans l'index du moteur de recherche.

    Selon le choix de l'utilisateur, cette note peut être ajustée par des conditions supplémentaires (par exemple, ce que l'on appelle la « recherche avancée »).

    Ensuite, un extrait est généré, c'est-à-dire que pour chaque document trouvé, le titre, un court résumé qui correspond le mieux à la requête et un lien vers le document lui-même sont extraits de la table des documents, et les mots trouvés sont mis en surbrillance.

    Les résultats de recherche résultants sont transmis à l’utilisateur sous la forme d’une SERP (Search Engine Result Page) – une page de résultats de recherche.

Comme vous pouvez le constater, tous ces composants sont étroitement liés les uns aux autres et fonctionnent en interaction, formant un mécanisme clair et plutôt complexe pour le fonctionnement du système de recherche, qui nécessite d'énormes quantités de ressources.

Aucun moteur de recherche ne couvre toutes les ressources Internet.

Chaque moteur de recherche collecte des informations sur les ressources Internet en utilisant ses propres méthodes et constitue sa propre base de données périodiquement mise à jour. L'accès à cette base de données est accordé à l'utilisateur.

Les moteurs de recherche mettent en œuvre deux manières de rechercher une ressource :

    Recherche par sujet catalogues - informations se présente sous la forme d’une structure hiérarchique. Au niveau supérieur se trouvent les catégories générales (« Internet », « Affaires », « Art », « Éducation », etc.), au niveau suivant, les catégories sont divisées en sections, etc. Le niveau le plus bas concerne les liens vers des pages Web spécifiques ou d’autres ressources d’information.

    Recherche par mot clé (recherche par index ou recherche détaillée) - l'utilisateur envoie au moteur de recherche demande, composé de mots-clés. Système Retourà l'utilisateur une liste de ressources trouvées sur demande.

La plupart des moteurs de recherche combinent les deux méthodes de recherche.

Les moteurs de recherche peuvent être locaux, mondiaux, régionaux et spécialisés.

Dans la partie russe d'Internet (Runet), les moteurs de recherche généraux les plus populaires sont Rambler (www.rambler.ru), Yandex (www.yandex.ru), Aport (www.aport.ru), Google (www. google.ru).

La plupart des moteurs de recherchemis en œuvre sous forme de portails.

Portail (de l'anglais.portail- entrée principale, portail) est un site Internet qui intègre différents services Internet : outils de recherche, courrier, actualités, dictionnaires, etc.

Les portails peuvent être spécialisés (comme,www. musée. ru) et général (par exemple,www. kilomètres. ru).

Recherche par mots-clés

L’ensemble de mots-clés utilisés pour la recherche est également appelé critère de recherche ou sujet de recherche.

Une requête peut consister en un mot ou en une combinaison de mots combinés par des opérateurs - des symboles par lesquels le système détermine l'action qu'il doit effectuer. Par exemple : la requête « Moscou Saint-Pétersbourg » contient l'opérateur ET (c'est ainsi qu'un espace est perçu), qui indique qu'il faut rechercher des documents contenant les deux mots - Moscou et Saint-Pétersbourg.

Pour que la recherche soit pertinente (de l'anglais pertinent - pertinent, pertinent), plusieurs règles générales sont à prendre en compte :

    Quelle que soit la forme sous laquelle le mot est utilisé dans la requête, la recherche prend en compte toutes ses formes de mots selon les règles de la langue russe. Par exemple, la requête « ticket » trouvera également les mots « ticket », « ticket », etc.

    Les majuscules ne doivent être utilisées que dans les noms propres pour éviter de voir des références inutiles. À la demande des « forgerons », par exemple, on trouvera des documents qui parlent à la fois des forgerons et des Kuznetsov.

    Il est conseillé d'affiner votre recherche à l'aide de quelques mots-clés.

    Si l'adresse recherchée ne figure pas parmi les vingt premières adresses trouvées, vous devez modifier la demande.

Chaque moteur de recherche utilise son propre langage de requête. Pour en prendre connaissance, utilisez l'aide intégrée du moteur de recherche

Les grands sites peuvent avoir des systèmes de recherche d'informations intégrés dans leurs pages Web.

En règle générale, les requêtes dans de tels systèmes de recherche sont construites selon les mêmes règles que dans les moteurs de recherche mondiaux. Cependant, la familiarité avec l'aide ici ne sera pas superflue.

Recherche Avancée

Les moteurs de recherche peuvent fournir un mécanisme permettant à l’utilisateur de créer une requête complexe. Suite à un lien Recherche Avancée permet de modifier les paramètres de recherche, de spécifier des paramètres supplémentaires et de sélectionner la forme la plus pratique pour afficher les résultats de la recherche. Ce qui suit décrit les paramètres qui peuvent être définis lors d'une recherche avancée dans les systèmes Yanex et Rambler.

Description des paramètres

Nom dans Yandex

Nom dansRandonneur

Où chercher des mots-clés (titre du document, corps du texte, etc.)

Filtre de dictionnaire

Recherche par texte...

Quels mots doivent ou ne doivent pas être présents dans le document et quelle doit être la précision de la correspondance

Filtre de dictionnaire

Rechercher des mots de requête... Exclure les documents contenant les mots suivants...

À quelle distance les mots-clés doivent-ils être situés ?

Filtre de dictionnaire

Distance entre les mots de requête...

Restriction sur la date du document

Date du document...

Limitez votre recherche à un ou plusieurs sites

Site/Haut

Rechercher des documents uniquement sur les sites suivants...

Limitation de la recherche par langue du document

Langue du document...

Rechercher des documents contenant une image avec un nom ou une signature spécifique

Image

Rechercher des pages contenant des objets

Objets spéciaux

Formulaire de présentation des résultats de recherche

Format du problème

Affichage des résultats de recherche

Certains moteurs de recherche (par exemple Yandex) vous permettent de saisir des requêtes en langage naturel. Vous écrivez ce que vous devez trouver (par exemple : commander des billets de train de Moscou à Saint-Pétersbourg). Le système analyse la demande et produit le résultat. Si vous n’en êtes pas satisfait, passez au langage de requête.