Un endroit où les informations sont stockées sur le réseau. Stockage de données sur Internet. L'esprit du commerce ou comment les centres de données gagnent de l'argent

Il s’agit d’informations qui alimentent toutes les entreprises modernes et qui sont désormais considérées comme l’atout stratégique le plus précieux de toute entreprise. Le volume d’informations croît de façon exponentielle parallèlement à la croissance des réseaux mondiaux et au développement du commerce électronique. Le succès dans la guerre de l’information nécessite une stratégie efficace pour stocker, protéger, partager et gérer votre actif numérique le plus important : les données, aujourd’hui et dans un avenir proche.

La gestion des ressources de stockage est devenue l’un des enjeux stratégiques les plus urgents auxquels sont confrontés les services informatiques. En raison du développement d’Internet et des changements fondamentaux dans les processus commerciaux, les informations s’accumulent à une vitesse sans précédent. Selon Strategic Research, au moins 200 pétaoctets d'informations sont aujourd'hui stockés sur les seuls serveurs de systèmes ouverts, et ce volume double tous les ans et demi. De nombreuses entreprises se sont lancées dans une sorte de compétition pour transformer leurs systèmes internes d'entreprise afin d'utiliser Internet pour leur développement. Ils mondialisent leurs systèmes informatiques pour mieux prendre en charge les applications de commerce électronique fonctionnant en continu 24 heures sur 24, 7 jours sur 7, 365 jours par an.

Le stockage de données en réseau permet de résoudre de nombreux problèmes commerciaux actuels liés au stockage d'informations, à savoir :

  • accès universel et partagé aux ressources ;
  • maintenir la croissance imprévisible et explosive du système informatique ;
  • assurer une disponibilité continue tout en maintenant la rentabilité ;
  • assurer l'évolutivité et la vitesse la plus élevée de l'entrepôt de données ;
  • créer les conditions nécessaires au fonctionnement de nouvelles applications, telles que les applications de sauvegarde, sans la participation d'un serveur et d'un réseau local ;
  • simplification de la gestion des ressources associée à leur centralisation ;
  • augmenter le niveau de sécurité de l'information et de tolérance aux pannes.

Jusqu'à présent, les produits de stockage en réseau étaient divisés en périphériques de stockage en réseau (NAS) et de réseau de stockage (SAN). Les produits NAS sont ancrés dans les réseaux Ethernet et conçus autour du concept de serveur de fichiers. Les produits SAN perpétuent la technologie de stockage SCSI et incluent plusieurs types conçus pour fournir des fonctionnalités d'E/S ; ceux-ci incluent les contrôleurs d’E/S système et les périphériques et sous-systèmes de stockage. Les produits SAN les plus connus sont ceux qui ont remplacé le bus parallèle SCSI par des commutateurs et des hubs.

Les produits SAN sont arrivés sur le marché plusieurs années plus tard que les produits NAS. Lorsque les deux technologies sont apparues sur le marché, les experts se sont interrogés sur leur avenir. Cette situation a donné lieu à un certain nombre de solutions intéressantes, notamment des tentatives de les diviser en deux architectures différentes. Bien que SAN et NAS soient de structure différente, ils sont en grande partie identiques et offrent le potentiel de différents types d'intégrations.

Technologies de stockage de données

Le stockage en réseau repose sur trois composants fondamentaux : la commutation, le stockage et les fichiers. Tous les produits de stockage peuvent être représentés comme une combinaison des fonctions de ces composants. Cela peut prêter à confusion au début : les produits de stockage ayant été développés dans des directions complètement différentes, leurs fonctionnalités se chevauchent souvent.

De nombreuses personnes ont passé de nombreuses heures à essayer de comprendre comment écrire la meilleure application pour attirer les clients du stockage réseau et comment rendre la technologie de stockage plus facile à comprendre en fonction de leur application réussie. Bien sûr, il existe de nombreuses façons de procéder, mais dans cet article, nous supposons que le stockage lui-même est une application. Le réseau exécute de nombreuses applications client-serveur et divers types d'applications distribuées, mais le stockage est un type d'application unique et spécialisé qui peut fonctionner dans plusieurs environnements réseau.

Les processus de stockage étant étroitement intégrés aux réseaux, il convient de rappeler que le stockage réseau est une application système. Les services fournis par les applications de stockage réseau peuvent être utilisés par des programmes d'entreprise complexes et des applications grand public. Comme pour de nombreuses technologies, certains types de systèmes sont mieux adaptés aux exigences d’applications complexes de haut niveau.

Commutation

Le terme commutation s'applique à tous les logiciels, matériels et services qui transportent et gèrent le stockage sur le stockage en réseau. Cela inclut divers éléments tels que le câblage, les contrôleurs d'E/S réseau, les commutateurs, les hubs, le matériel de récupération d'adresses, le contrôle des liaisons de données, les protocoles de transport, la sécurité et les réserves de ressources. Les technologies de bus de données SCSI et ATA sont encore largement utilisées dans le stockage en réseau et continueront probablement à être utilisées pendant longtemps. En fait, les produits SCSI et ATA sont aujourd'hui utilisés beaucoup plus fréquemment dans la technologie NAS.

Il existe deux différences importantes entre les SAN et les LAN classiques. Les réseaux de stockage (SAN) synchronisent automatiquement les données entre des systèmes et des emplacements de stockage distincts. Le stockage réseau nécessite des composants haute fidélité pour fournir un environnement fiable et prévisible. Malgré ses limites en matière de distance, le SCSI parallèle est une technologie extrêmement fiable et prévisible. Si de nouvelles technologies de commutation telles que Fibre Channel, Ethernet et InfiniBand remplacent SCSI, elles devront démontrer des niveaux de fiabilité et de prévisibilité égaux ou supérieurs. Il existe également un point de vue qui considère la commutation comme un canal de stockage. Le terme même de « canal », qui trouve son origine dans l'environnement des grands ordinateurs, implique une fiabilité et des performances élevées.

Stockage

Le stockage affecte principalement les opérations de bloc d'espace d'adressage, y compris la création d'un environnement virtuel dans lequel les adresses de blocs de stockage logiques sont mappées d'un espace d'adressage à un autre. De manière générale, la fonctionnalité de stockage du stockage en réseau n'a pas beaucoup changé, à l'exception de deux différences notables.

Le premier est la possibilité de trouver des technologies de virtualisation des appareils, telles que la gestion des appareils au sein des équipements de stockage réseau. Ce type de fonctionnalité est parfois appelé contrôleur de domaine de stockage ou virtualisation LUN.

Le deuxième différenciateur majeur du stockage est l’évolutivité. Les produits de stockage, tels que les sous-systèmes de stockage, disposent de beaucoup plus de contrôleurs/interfaces que les générations précédentes de technologie de bus, ainsi que d'une capacité de stockage beaucoup plus grande.

Des dossiers

La fonction d'organisation des fichiers présente un objet abstrait à l'utilisateur final et aux applications, et organise la disposition des données sur des périphériques de stockage réels ou virtuels. L'essentiel des fonctionnalités des fichiers dans le stockage réseau est fourni par les systèmes de fichiers et les bases de données ; elles sont complétées par des applications de gestion du stockage telles que les opérations de sauvegarde, qui sont également des applications de fichiers.

Jusqu'à présent, le stockage réseau n'a fait que peu de différence dans les fonctions de fichiers, à l'exception du développement des systèmes de fichiers NAS, en particulier du système de fichiers WAFL de Network Appliance.

Outre les technologies de stockage de données NAS et SAN mentionnées, orientées vers les grands réseaux mondiaux, dans les petits réseaux locaux, la position dominante est occupée par la technologie DAS (Direct Attached Storage - Fig. 1), selon laquelle le stockage est situé à l'intérieur du serveur, fournissant le volume de stockage et la puissance de calcul nécessaire.

L'exemple le plus simple d'un DAS serait un disque dur à l'intérieur d'un ordinateur personnel ou un lecteur de bande connecté à un seul serveur. Les requêtes d'E/S (également appelées commandes ou protocoles de transfert de données) accèdent directement à ces appareils. Cependant, ces systèmes ne s'adaptent pas bien et les entreprises sont obligées d'acheter des serveurs supplémentaires pour augmenter leur capacité de stockage. Cette architecture est très coûteuse et ne peut être utilisée que pour créer de petits entrepôts de données.

Réseau de zones de mémorisation

Le système de stockage de données SAN (Fig. 2) est implémenté dans un réseau local spécialisé. Comme avec DAS, les requêtes d’E/S accèdent directement aux périphériques de stockage. Dans la plupart des réseaux modernes, un SAN utilise Fibre Channel hautes performances, qui fournit une connectivité arbitraire entre les processeurs et les périphériques de stockage du réseau.

Les systèmes de stockage SAN permettent de résoudre les problématiques suivantes : commutation logicielle, création de stockage distant, consolidation du stockage, création de stockage hétérogène et sauvegarde.

Changement de logiciel. La nécessité de résoudre ce problème est née de situations dans lesquelles un système d'information dispose d'un ensemble assez important de systèmes de disques et qu'il est nécessaire de connecter de temps en temps des ensembles de disques à différents serveurs. Dans le cas des disques SCSI classiques, cela nécessite une reconnexion physique, nécessitant souvent un arrêt du système. Cependant, l'utilisation du protocole Fibre Channel, des hubs FC et des commutateurs FC permet d'utiliser une méthode logicielle. Il est important de noter que chaque lecteur est ainsi connecté à un seul serveur. Aujourd'hui, ces solutions sont utilisées avec succès et leur développement ultérieur permettra de prendre en charge un plus grand nombre d'hôtes et d'accroître la flexibilité de la commutation.

Stockages distants. Les améliorations technologiques ont permis de placer des baies de disques à des distances allant jusqu'à 10 km du serveur, garantissant ainsi la protection des données contre les catastrophes.

Consolidation du stockage. Tout d’abord, la consolidation du stockage permet d’importantes économies d’exploitation et une plus grande fiabilité du système.

Stockages hétérogènes. La consolidation du stockage conduit à des connexions hétérogènes à la baie de disques, car il existe toujours des plates-formes logicielles et matérielles différentes dans le système d'information.

Sauvegarde directe. L'idée de la sauvegarde directe est de fournir une copie directe des données du disque vers la bande, en contournant le réseau local. Ainsi, la puissance du processeur des serveurs sera utilisée au minimum.

Stockage en réseau

Un périphérique de stockage NAS (Fig. 3) doté d'une interface réseau (appliance) contient généralement un processeur serveur et un système de stockage sur disque et est connecté à un réseau basé sur le protocole TCP/IP (LAN ou WAN). Les périphériques NAS sont accessibles à l'aide de protocoles spéciaux d'accès aux fichiers et de partage de fichiers. Les demandes de fichiers reçues par le périphérique NAS sont traduites par le processeur interne au niveau de demande d'E/S du périphérique de stockage. Les protocoles d'accès aux fichiers les plus courants sont les protocoles CIFS (Common Internet File System), utilisés sur les plates-formes Windows, et NFS (Network File System - un système de fichiers réseau utilisé sur les plates-formes UNIX). Ces protocoles s'exécutent au-dessus du protocole IP utilisé sur les réseaux Ethernet et Internet. Leur objectif est d'échanger des fichiers entre ordinateurs, grâce auxquels les clients Windows, Macintosh et UNIX ont un accès complet à la baie de disques.

L'une des principales caractéristiques intéressantes du NAS est qu'il facilite l'administration de l'ensemble de la solution réseau en installant votre propre système d'exploitation « léger » sur le NAS.

Technologies de commutation

Canal Fibre

Le principal avantage de la technologie Fibre Channel est qu'il s'agit d'un réseau à haut débit et à faible latence doté d'une technologie avancée de contrôle de flux - traitant le trafic en rafale tel que les E/S de stockage. Il convient de noter que c'est précisément cette caractéristique qui est faible en Ethernet. Le secteur Fibre Channel n'est pas comparable à Ethernet et dispose donc d'un petit choix de technologies et d'une expérience relativement limitée en matière de mise en œuvre et de gestion.

La technologie Fibre Channel a été le premier développement légal de la commutation générale. Cependant, comme cela a été prouvé à plusieurs reprises, la technologie à elle seule ne résout rien. L’industrie Fibre Channel n’était pas intéressée par le potentiel offert. Cette technologie a commencé comme une norme de facto pour les SAN, mais il est peu probable que Fibre Channel soit utilisée dans les NAS et entre sur le marché client-serveur.

Ethernet

Ethernet est la technologie réseau la plus répandue au monde ; Il existe un grand nombre de spécialistes et de nombreuses méthodes pour mettre en œuvre et gérer les réseaux Ethernet. Bien que les variétés Ethernet 10/100 Mbps soient suffisantes pour les NAS, elles ne conviennent pas à la prise en charge des SAN en raison des limitations de bande passante et du manque de contrôle de flux. Par conséquent, la base pour construire un SAN sera apparemment Gigabit Ethernet.

Il ne fait aucun doute qu'Ethernet sera utilisé comme fonction de commutation générale pour les applications de fichiers et de stockage, mais sa pertinence pour le stockage doit être prouvée avant qu'il ne soit largement adopté en tant que réseau industriel d'entreprise.

InfiniBande

InfiniBand - un bus de données série - remplace le bus d'E/S du système PCI. Le développement d'InfiniBand a été dirigé par Intel Corporation en collaboration avec Compaq, Hewlett-Packard, IBM, Sun et d'autres. En tant que composant système de base qui devrait être utilisé sur les plates-formes PC et UNIX, InfiniBand est susceptible d'être utilisé à une échelle significative.

Les questions suivantes se posent concernant le stockage réseau : Les applications de fichiers et de stockage s'exécuteront-elles directement sur le bus InfiniBand ou nécessiteront-elles des adaptateurs réseau InfiniBand ? Et quand cela arrivera-t-il – immédiatement, bientôt, dans quelques années ou jamais du tout ? Il semble que la technologie doit faire ses preuves en tant que bus d'E/S système général avant de pouvoir conquérir efficacement de nouveaux marchés tels que celui du stockage en réseau. Cependant, InfiniBand a clairement le potentiel de devenir une fonction de commutation grand public à l'avenir.

Le stockage d’entreprise est une idée géniale mais problématique. Comment un moteur de stockage autogéré peut-il devenir suffisamment intelligent pour fournir des services de gestion et de contrôle des données qu’il stocke ? La prise en charge des fonctions de couche de stockage par les sous-systèmes de stockage leur permet d'agir comme des périphériques « super-virtuels », mais cela ne leur donne pas la possibilité de manipuler des objets de données (par exemple, des fichiers) comme le souhaiteraient les responsables des technologies de l'information.

Cette solution est bien plus complexe que le simple placement de microprocesseurs dans des sous-systèmes de stockage. Les moteurs de stockage autogérés doivent être capables de déterminer quels blocs correspondent à des objets de données spécifiques (c'est-à-dire des fichiers, des tables de base de données et des métadonnées) s'ils doivent les gérer. Il semble que le « chaînon manquant » réside dans une certaine quantité de fonctionnalités de fichier intégrées qui devraient permettre d'associer des objets de données à leur emplacement de stockage. Ceci relève entièrement de la responsabilité de la couche de structure de données de la pile d’E/S. Cette couche peut être considérée comme la « couche inférieure » du système de fichiers, qui contrôle le placement des objets de données dans un stockage réel ou virtuel.

Le défi architectural des NAS et SAN réside dans le fait que les sous-systèmes de stockage dotés d'une technologie de fichiers intégrée sont généralement considérés comme des produits NAS. Comment alors appeler un sous-système de stockage avec un demi-système de fichiers ? C'est pourquoi l'analyse du stockage réseau en termes de SAN ou de NAS ne donne rien. NAS et SAN sont des entités indépendantes ; La commutation, le stockage et les fichiers sont également indépendants.

La technologie NAS, d'une part, fournit un service qui permet aux applications et aux utilisateurs de rechercher des données sous forme d'objets sur le réseau, et d'autre part, elle fournit au système des données à stocker dans des périphériques ou sous-systèmes de stockage. Et la technologie SAN fournit des fonctions de stockage réseau ; De manière générale, elle s'applique à des blocs logiques d'adresses, mais peut potentiellement utiliser d'autres méthodes d'adressage et d'identification des données stockées.

La transition vers les réseaux de stockage doit être extrêmement rapide et fiable. Jusqu'à présent, Fibre Channel a joué ce rôle, mais Gigabit Ethernet et InfiniBand devraient entrer sur le marché à l'avenir. Le développement d’une infrastructure de communication commune pour les applications basées sur des fichiers (NAS) et sur le stockage (SAN) semble inévitable et deviendra à terme une technologie clé.

Dans un avenir proche, les technologies de stockage en réseau telles que SAN et NAS seront utilisées partout, tout simplement parce que la quantité d'informations sur Terre double chaque année.

OrdinateurPress 2"2002

MINISTÈRE DE L'ÉDUCATION ET DES SCIENCES DE LA FÉDÉRATION DE RUSSIE

Établissement d'enseignement public d'enseignement professionnel supérieur

"INSTITUT PÉDAGOGIQUE D'ÉTAT DE TAGANROG du nom d'A.P. Tchekhov"

Faculté d'informatique

Département d'informatique et de gestion

Travaux de cours

Organisation du stockage et de la récupération des informations sur Internet

étudiants de 4ème année

Sheverda M.A.

Informatique avec supplément spécialiste. Une langue étrangère

Directeur scientifique

K.T.N. Assoc. Tyushnyakova I.A.

Taganrog

Introduction

Concepts de base de la recherche d'informations

Infrastructure de réseau

L'histoire des moteurs de recherche

1 Historique de la création du moteur de recherche Google

2 Comment fonctionne le moteur de recherche Google

3 Moteur de recherche Yandex

4 Moteur de recherche Rambler

5 Moteur de recherche Yahoo

6 Recherche par URL

Recherche d'informations sur Internet

Sauvegarde d'informations sur Internet

Conclusion

Bibliographie

Introduction

Internet est un réseau informatique mondial qui héberge divers services (E-mail, Word Wide Web, FTP, Usenet, Telnet, etc.). Les réseaux informatiques sont conçus pour la transmission de données, les réseaux téléphoniques et les réseaux radio sont destinés à la transmission de la voix et les réseaux de télévision sont destinés à la transmission d'images.

Selon les distances entre les PC, on distingue les réseaux informatiques locaux, territoriaux et d'entreprise. La convergence des réseaux de télécommunications (réseaux informatiques, radio, téléphone et télévision) offre la possibilité d'une transmission de données, de voix et d'images de haute qualité sur des réseaux unifiés (multiservices) de nouvelle génération (réseaux Internet).

Internet est depuis longtemps devenu non seulement un moyen de communication, mais aussi un terrain d'activité commerciale sérieuse. Presque toutes les entreprises étrangères disposent de leur propre bureau de représentation sur Internet, un bureau virtuel. Le chiffre d'affaires total des entreprises faisant du commerce sur Internet atteint des milliards de dollars. En Russie, un nombre croissant d’entreprises utilisent également Internet pour promouvoir leurs produits et services. Vous pouvez facilement le vérifier en consultant les publications publicitaires. À côté des numéros de téléphone et de fax habituels, on trouve de plus en plus d'adresses e-mail et de sites Web. Bientôt, l’absence d’adresse Internet rendra le travail aussi difficile que l’absence de fax.

Par conséquent, de plus en plus de personnes se tournent vers Internet pour obtenir les dernières informations : sur les services et les prix, la météo, les taux de change, juste des actualités. Le site Web peut modifier les informations plusieurs fois par jour. Dans la presse écrite, il faut commander la publicité au moins une semaine à l'avance, voire plus. Et sur Internet, tout va vite : de nouveaux produits ou services, une nouvelle remise ou un nouveau fournisseur - demain les clients le découvriront. Il n'est pas nécessaire d'attendre la sortie de la prochaine annonce imprimée. Les informations sur le site seront toujours à jour et à jour. C’est ce qui est valorisé, c’est ce qui attire des millions d’utilisateurs sur Internet.

La condition la plus importante et le principal facteur déterminant le succès des activités éducatives utilisant les technologies informatiques est la préparation des étudiants à des activités productives dans un environnement informatique didactique.

La plupart des chercheurs dans le domaine de l'informatique pédagogique notent l'existence d'une contradiction entre les idées du paradigme moderne d'éducation humanitaire et personnelle et le système d'éducation existant avec une orientation thématique étroite, qui ne garantit pas la préparation de l'étudiant aux activités éducatives utilisant des méthodes informatiques. pour obtenir et convertir des informations. Il devient évident que les concepts d'utilisation des technologies de l'information dans le processus éducatif évoluent des paradigmes technocratiques vers le renforcement du rôle des facteurs socioculturels, en tenant compte du potentiel moral et intellectuel de l'individu.

Maîtriser des méthodes et moyens efficaces de recherche, de traitement et d'utilisation de l'information pédagogique permet non seulement d'intensifier les processus éducatifs, mais également de développer les intérêts cognitifs des étudiants et le désir d'activité productive et créative.

Objectif du cours :

Explorez les systèmes et mécanismes existants pour rechercher des informations sur Internet.

Objectifs du cours :

1. Étudiez la littérature spécialisée pertinente à ce sujet.

À partir des connaissances acquises grâce à cette littérature, découvrez comment sont structurés les processus de stockage et de récupération d'informations sur le réseau mondial.

Trouvez des similitudes et des différences entre les moteurs de recherche.

1.
Concepts de base de la recherche d'informations

Système de recherche d'informations (IPS) est une collection ordonnée de documents (tableaux de documents) et de technologies de l'information conçues pour stocker et récupérer des informations - textes (documents) ou données (faits). Les systèmes de recherche d'informations sont des référentiels d'informations organisés d'une manière spécifique. De plus, les systèmes de recherche d’informations peuvent également être non automatisés. L'essentiel est la fonction cible : stocker et récupérer des informations.

Selon l'objet de stockage et le type de demande, on distingue deux types de recherche d'informations : documentaire et factuelle - et, par conséquent, deux types de systèmes de recherche d'informations - documentaires et factuels.

Documentaire sont appelés systèmes de recherche d'informations, qui mettent en œuvre une recherche de requêtes thématiques dans un ensemble de documents ou de textes, puis fournissent à l'utilisateur un sous-ensemble de ces documents ou leurs copies. Le concept d'un document peut varier d'un système à l'autre. Dans le cas général, il s'agit d'un certain objet d'information, enregistré (généralement via un système de signes) sur un support matériel (papier, photo et film, etc.) et destiné à être transmis dans l'espace et dans le temps dans le système de communication sociale.

Factuel Les systèmes de recherche d'informations mettent en œuvre le stockage, la recherche et la délivrance de données directement factuelles (caractéristiques et propriétés scientifiques, techniques, économiques des objets, processus, phénomènes, adresses, noms, données quantitatives, etc.).

La principale différence entre la recherche documentaire et factuelle réside dans l'approche de la sémantique des documents. Les systèmes documentaires décrivent la signification des documents dans leur ensemble du point de vue de leur contenu thématique et thématique. Dans ce cas, il est important d'identifier et de nommer (lister) les principaux thèmes et objets auxquels le document est consacré. Dans les systèmes factuels, les objets sont décrits, leurs caractéristiques et la signification de ces caractéristiques sont enregistrées. D'où les différences dans les langages de description et les méthodes de stockage des descriptions dans le système. Ainsi, chaque type de recherche possède ses propres outils de recherche.

Les systèmes factuels impliquent l’accumulation et la recherche dans un ensemble de documents avec une structure strictement réglementée. Une telle structure est soit le résultat d'un traitement intellectuel préliminaire des documents lors de la saisie des informations dans le système, soit de la disponibilité de ces documents sous forme finie dans des domaines spécifiques de l'activité humaine, par exemple les formulaires comptables, les formulaires, les ouvrages de référence, les calendriers, etc. . Il existe des systèmes d'information factuels qui permettent d'accumuler des informations et de rechercher un seul type d'objet et un seul type de requête. Il existe également des systèmes factographiques plus développés qui permettent le stockage et la récupération de données de contenu et de structure divers, mais cette diversité est toujours limitée.

Dans le même temps, il n’existe pas de différence insurmontable entre les systèmes documentaires et factuels. Souvent, les systèmes réels de recherche d'informations sont un exemple de systèmes mixtes dans lesquels des informations factuelles sont utilisées comme moyen supplémentaire de recherche documentaire, et vice versa. Dans les systèmes documentaires, les textes (documents) peuvent également être structurés, divisés en fragments ou champs, et le traitement et la fourniture d'informations documentaires peuvent être effectués au niveau de champs individuels.

Il existe également un troisième type de systèmes, appelés informationnels. Il s'agit de systèmes qui répondent à des requêtes auxquelles la base d'informations ne répond pas explicitement. Une base de connaissances extralinguistiques et des informations générées algorithmiquement à partir de ce qui est déjà disponible (documentaire ou factuel) permettent d'obtenir une réponse. Ces nouvelles informations sont soit fournies en réponse à une requête, soit utilisées en complément pour la recherche.

Un système de recherche d'informations de type document est un ensemble ordonné de documents, ainsi qu'un ensemble d'outils et de méthodes conçus pour stocker, rechercher et émettre des informations documentaires sur demande. Documentaire IPS délivre des documents qui correspondent à la demande sur le thème ou le sujet.

La plupart des systèmes d'information fonctionnels appartiennent à la classe des systèmes verbaux de type non thésaurus, lorsque les termes d'indexation sont sélectionnés directement à partir des textes des documents. La croissance en avalanche du volume d'informations documentaires électroniques, de leur type, de leur diversité thématique et linguistique est à la fois la cause de la crise de la recherche d'informations moderne et l'incitation à son amélioration.

Le problème de la recherche de ressources sur Internet s'est réalisé assez rapidement et en réponse, divers systèmes et outils logiciels de recherche sont apparus, parmi lesquels les systèmes Gopher, Archie, Veronica, WAIS, WHOIS, etc. Récemment, ces outils ont été remplacé par « clients » et « serveurs » du World Wide Web WWW.

Si l’on essaie de classer les IPS d’Internet, on peut distinguer les principaux types suivants :

IPS de type verbal (moteurs de recherche)

Classement IRS (annuaires)

Annuaires électroniques (pages jaunes, etc.)

Systèmes d'information spécialisés pour certains types de ressources

Agents intelligents.

La comptabilité globale de toutes les ressources Internet est assurée par des systèmes de classification verbale et en partie.

2. Infrastructure de réseau (structure et principes de construction d'Internet)

Un réseau informatique d'information mondial, qui est une association de nombreux réseaux informatiques régionaux et d'ordinateurs qui échangent des informations entre eux via des canaux de télécommunications publics (lignes téléphoniques analogiques et numériques dédiées, canaux de communication optiques et canaux radio, y compris les lignes de communication par satellite).

Les informations sur Internet sont stockées sur des serveurs. Les serveurs ont leurs propres adresses et sont contrôlés par des programmes spécialisés. Ils vous permettent de transférer du courrier et des fichiers, de rechercher des bases de données et d'effectuer d'autres tâches.

L'échange d'informations entre les serveurs du réseau s'effectue via des canaux de communication à haut débit (lignes téléphoniques dédiées, canaux de communication fibre optique et satellite). L'accès des utilisateurs individuels aux ressources d'information Internet s'effectue généralement via un fournisseur ou un réseau d'entreprise.

Fournisseur - fournisseur de services réseau - une personne ou une organisation fournissant des services de connexion aux réseaux informatiques. Le fournisseur est une organisation qui dispose d'un pool de modems pour se connecter aux clients et accéder au World Wide Web.

Les principales cellules du réseau mondial sont les réseaux locaux. Si un réseau local est directement connecté à un réseau mondial, alors chaque poste de travail de ce réseau peut y être connecté. Il existe également des ordinateurs directement connectés au réseau mondial. Ils sont appelés ordinateurs hôtes (hôte - maître). Un hôte est tout ordinateur faisant partie intégrante d’Internet, c’est-à-dire connecté via le protocole Internet à un autre hôte, qui à son tour est connecté à un autre, et ainsi de suite.

Riz. 1. Structure du réseau Internet mondial

Pour connecter les lignes de communication aux ordinateurs, des appareils électroniques spéciaux sont utilisés, appelés cartes réseau, adaptateurs réseau, modems, etc.

Presque tous les services Internet sont construits sur le principe client-serveur. Toutes les informations sur Internet sont stockées sur des serveurs. L'échange d'informations entre les serveurs s'effectue via des canaux de communication à haut débit ou des autoroutes. Les serveurs connectés par des autoroutes à grande vitesse constituent la partie fondamentale d’Internet.

Le transfert d'informations vers Internet est assuré par le fait que chaque ordinateur du réseau possède une adresse unique (adresse IP) et que les protocoles réseau assurent l'interaction de différents types d'ordinateurs exécutant différents systèmes d'exploitation.

Internet utilise principalement la famille de protocoles réseau TCP/IP (pile). Au niveau des couches de liaison de données et physiques, la pile TCP/IP prend en charge Ethernet, FDDI et d'autres technologies. La base de la famille de protocoles TCP/IP est la couche réseau, représentée par le protocole IP, ainsi que divers protocoles de routage. Cette couche facilite le mouvement des paquets sur le réseau et contrôle leur routage. La taille du paquet, les paramètres de transmission et le contrôle d'intégrité sont effectués au niveau de la couche de transport TCP.

La couche application intègre tous les services que le système fournit à l'utilisateur. Les principaux protocoles d'application comprennent : le protocole d'accès à distance telnet, le protocole de transfert de fichiers FTP, le protocole de transfert hypertexte HTTP, les protocoles de messagerie : SMTP, POP, IMAP, MIME.

3. Historique des moteurs de recherche

Revue comparative des moteurs de recherche

Avec le développement d'Internet dans le monde, le problème de la recherche d'informations sur Internet est apparu. Plusieurs grandes entreprises, comme Altavista, Lycos, AOL, ont immédiatement tenté d'occuper ce créneau. Naturellement, chacun d’eux a développé ses propres méthodes de recherche d’informations. Il s'agit à la fois d'une méthode manuelle dans les annuaires et d'une méthode de recherche automatique de sites sur Internet et de leur indexation à l'aide de « spiders » spécialement conçus à cet effet. Leur objectif était, en commençant par plusieurs grands sites Web, d'indexer l'ensemble de l'Internet en utilisant les liens et les groupes de discussion disponibles sur ceux-ci. Mais comme il fallait attendre très longtemps pour qu'une telle araignée atteigne votre site, il a été décidé que des webmasters tiers ajouteraient manuellement des liens vers la base de données de l'araignée, après quoi l'araignée pourrait rapidement indexer la ressource.

L’émergence de systèmes similaires dans la CEI a commencé de manière presque similaire. Il s'agit par exemple de Russian Express, Rambler, Aport et Yandex, car ils utilisent également des robots pour rechercher de nouveaux sites. L'une des différences entre les moteurs de recherche CIS est qu'ils indexent uniquement les sites CIS ou vérifient l'encodage (langue) du texte - comme Aport. Voici un extrait de la FAQ Yandex :

Yandex classe les documents selon le paramètre calculé « pertinence ». La pertinence d'un document dépend non seulement du nombre de mots recherchés trouvés dans le document, mais aussi des caractéristiques de fréquence des mots recherchés, du poids du mot ou de l'expression, de la proximité des mots recherchés dans le texte du document. les uns aux autres, etc.

Des titres comme "type_Document_Title_here" ou "Web Page Title Here" ou "Insert Page Title Here" ou "Put_Your_Title_Here" ou "Title" ne décorent ni la page ni son webmaster. De plus, de nombreux moteurs de recherche, dont Yandex, accordent une attention particulière aux mots contenus dans le titre. Vous ne devriez pas prendre les 10 premiers mots les plus recherchés dans certains Top100 et les écrire dans des titres, des commentaires et simplement du texte brut. Premièrement, cela n’ajoute pas de renommée au créateur et irrite naturellement les utilisateurs. Deuxièmement, les moteurs de recherche, ainsi que Yandex, commencent à lutter contre cela. De plus, le spam augmente la taille du document et réduit donc le contraste des mots qu'il contient.

Mais d’ailleurs, il faut aussi éviter le spam. Un mot répété plus de 30 fois sur la première page réduira considérablement la pertinence de la page dans son ensemble. Et pourtant, les moteurs de recherche russes ne prennent pas en charge les balises méta, donc lors de la création d'une page Web en russe, assurez-vous que le titre contient des expressions pertinentes, ainsi qu'elles sont présentes en haut du texte.

3.1 Historique de la création du moteur de recherche GOOGLE

En 1995, deux doctorants de l'Université de Stanford, Larry Page et Sergey Brin, travaillaient sur divers aspects de la gestion des données. C'est Page en 1996 qui a commencé à utiliser activement Internet pour ses projets de recherche dans le domaine de l'exploration de données - alors le Web n'était pour Page qu'une source d'informations sélectionnées au hasard pour ses développements. Les deux étudiants faisaient partie du groupe de travail MIDAS (Mining Data at Stanford). Un peu plus tard, sous la direction de Rajeev Motwani, professeur adjoint au Département d'informatique, Page et Brin, originaire de Moscou, ont commencé à développer leur propre moteur de recherche. Déjà à cette époque, diverses sociétés fournissant des services de recherche étaient présentes sur le marché Internet, mais pour les futurs docteurs en sciences, le projet s'apparentait à un plaisir académique - personne ne pensait à une capitalisation rapide et à la création d'un plan d'affaires. L'idée qui constitue la base du moteur de recherche a été décrite dans plusieurs articles scientifiques et est en même temps assez simple à comprendre.

Le réseau contient une énorme quantité d'informations et la plupart des moteurs de recherche tentent de déterminer la pertinence d'une seule page par la présence dans le fichier HTML de mots-clés que l'utilisateur a saisis dans le formulaire de recherche. Google indexe les liens provenant de la page, considérant chaque lien vers un site spécifique comme une « voix » qui augmente la valeur du site vers lequel il est lié. Il est logique de supposer qu’un site populaire et contenant des informations utiles sera consulté plus souvent qu’une ressource inutile et sans intérêt.

Cependant, déterminer la pertinence d’un site ne s’arrête pas là. Le résultat obtenu - une évaluation conditionnelle de la popularité des ressources - peut également être utilisé comme source d'informations sur les sites vers lesquels pointent ces ressources de la plus haute qualité. Ainsi, un lien vers votre page depuis Yahoo! ou About.com peuvent avoir plus de valeur que des centaines de liens provenant de pages d'accueil inconnues - dans ce cas, Yahoo! et About.com sont considérés comme des sources faisant autorité et contiennent donc des liens vers des sites de haute qualité.

En 1998, Google a été lancé sur un serveur de l'Université de Stanford et peut être consulté sur google.Stanford.edu. À une époque où d'autres startups recevaient des financements sans avoir encore rédigé de business plan ni développé leur propre produit, les pères fondateurs de Google considéraient que des recherches supplémentaires n'interféreraient pas avec le fonctionnement du moteur de recherche, et au moment de la création de l'entreprise, un serveur de recherche basé sur la technologie Page Rank fonctionnait déjà depuis plus de deux ans. En 1996, les étudiants ont remarqué que leur développement fournissait dans de nombreux cas des résultats plus précis que les autres moteurs de recherche, et en 1997, Google est devenu le moteur de recherche interne de l'Université de Stanford. La même année, Page et Brin engagent leurs premières dépenses liées au développement ultérieur de Google : ils achètent des disques durs d'une capacité totale de 1 téléviseur, ce qui leur coûte 15 000 dollars. Jusqu'à présent, toutes les dépenses doivent être couvertes par leurs propres moyens. cartes de crédit.

En septembre 1998, il est devenu évident que pour développer davantage la technologie et commencer à la concéder sous licence aux parties intéressées, il était nécessaire de créer une entreprise. Page et Brin quittent Stanford six mois avant de soutenir leur thèse de doctorat et emmènent avec eux Craig Silverstein, nommé directeur technique. À un moment donné, des passionnés rencontrent l'un des fondateurs de Sun Microsystems, Andy Bechtolsheim, et après l'avoir interrogé sur les projets futurs de l'entreprise, il fait immédiatement un chèque de 100 000 $ aux anciens étudiants. histoire du développement d'Internet la forte croissance des entreprises médiatiques. Tous les moteurs de recherche, qui offraient auparavant à leurs utilisateurs la possibilité de trouver les informations nécessaires sur Internet, ont soudainement décidé de commencer à fournir des services Internet : courrier gratuit, cotations boursières et autres attributs du portail. Lorsque Page rencontre George Bell, PDG d'Excite, il n'exprime aucun intérêt pour cette technologie de recherche unique. "Tant que notre moteur de recherche est dans un état plus ou moins correct, nous en sommes satisfaits", déclare Bell, laissant entendre que la recherche elle-même n'est plus un objet d'intérêt pour les portails.

Et Google a dû suivre sa propre voie. Au lieu de commercialiser et de promouvoir leur projet de manière agressive, Page et Brin choisissent d'embaucher environ 150 employés, dont 20 titulaires d'un doctorat. L'entreprise ne se fait pas de publicité en achetant des millions de bannières, ne se soucie pas de l'image de marque et du développement du marché du projet et n'a pas l'intention de gagner de l'argent en affichant des bannières publicitaires sur son propre site Web. Malgré une telle passivité du point de vue du marketeur, la popularité du moteur de recherche continue de croître et de nombreux utilisateurs, habitués à accéder à plusieurs moteurs de recherche en même temps, choisissent Google, chacun pour leurs propres raisons subjectives. Certaines personnes aiment l'interface discrète et la facilité d'utilisation, d'autres aiment la rapidité de fonctionnement et le site n'est pas surchargé de publicités, certains aiment la qualité des résultats de recherche.

Un expert bien connu en matière d'utilisabilité aux États-Unis, Jacob Nielsen, qui est membre du conseil d'administration de Google, a déclaré un jour, évoquant le moteur de recherche : "Je les considère comme mes meilleurs clients. Leur entreprise entière est obsédée par le idée de commodité et de facilité d’utilisation. D'ailleurs, convaincu de la faveur des utilisateurs pour les moteurs de recherche à interface simple, Altavista sort un nouveau shell pour son moteur de recherche, annonçant Raging Search (#"607685.files/image002.gif">

Riz. 1. L'optimisation des moteurs de recherche n'affecte que les principaux résultats de recherche et n'affecte pas les liens payants, tels que la publicité contextuelle AdWords.

L'optimisation du site Web doit être centrée sur l'utilisateur. Ils constituent le public cible du site et utilisent les moteurs de recherche pour le trouver. Un dévouement excessif à des astuces spécifiques pour atteindre le maximum au sommet peut ne pas apporter les résultats souhaités. L'optimisation des moteurs de recherche n'est qu'un moyen de garder un peu d'avance en matière de visibilité sur les moteurs de recherche.

Le titre de la page principale du site peut contenir le nom du site ou de l'organisation, ainsi que d'autres informations utiles, telles que l'adresse et une brève description du sujet ou des services.

Riz. 3. L'utilisateur envoie une demande de [cartes de vœux]

Figure 4. la page apparaît dans les résultats de recherche dont le titre sera la première ligne (à noter que les mots issus de la requête de recherche sont en gras)

Riz. 5. Si l'utilisateur décide d'aller vers une autre page, son nom apparaîtra dans la barre de titre de la fenêtre du navigateur

Les titres des autres pages du site doivent également décrire avec précision leur contenu, et peuvent contenir le nom du site ou de la société.

Riz. 6. L'utilisateur envoie une demande de [Cartes de vœux de bonne année]

Riz. 7. Une page pertinente de notre site apparaît dans les résultats de recherche (son nom décrit son contenu)

3.3 Moteur de recherche - Yandex

Figure 8. Moteur de recherche Yandex

Le moteur de recherche Yandex.ru a été officiellement annoncé le 23 septembre 1997 lors du salon Soft Tool. Les principales caractéristiques distinctives de Yandex.ru à cette époque étaient la vérification du caractère unique des documents. Egalement les propriétés clés du moteur de recherche Yandex, à savoir : prise en compte de la morphologie de la langue russe, recherche en tenant compte de la distance. Un algorithme soigneusement développé pour évaluer la pertinence (conformité à la réponse à la requête), prenant en compte non seulement le nombre de mots de requête trouvés dans le texte, mais aussi le « contraste » du mot (sa fréquence relative pour un document donné) , la distance entre les mots et la position du mot dans le document. Un peu plus tard, dans la section « Contes de fées », est apparu le premier conte de fées Runet - « Web - humanisme ou chernukha ? Et dans la section "Chiffres", vous trouverez la première estimation du volume de Runet, 5 000 serveurs et 4 Go de textes.

Deux mois plus tard, en novembre 1997, la requête en langage naturel était implémentée. Désormais, vous pouvez accéder à Yandex.ru simplement « en russe », poser de longues questions, par exemple : « où acheter un ordinateur », « produits génétiquement modifiés » ou « indicatifs téléphoniques internationaux » et recevoir des réponses précises. La longueur moyenne d'une requête sur Yandex.ru est désormais de 2,7 mots. En 1997, il s'agissait de 1,2 mots, puis les utilisateurs des moteurs de recherche étaient habitués au style télégraphique. En 1998, Yandex.ru a introduit la possibilité de « trouver un document similaire », une liste de serveurs trouvés, d'effectuer une recherche dans une plage de dates spécifiée et de trier les résultats de recherche selon l'heure de la dernière modification. Au cours de cette année, le « volume » de l'Internet russe a doublé, ce qui a conduit à la nécessité d'optimiser les moteurs de recherche. Hier et aujourd'hui (avec un volume de 200 Go), la vitesse de recherche sur Yandex.ru est d'une fraction de seconde. En 1999, Runet a connu une croissance considérable, tant en volume de textes qu'en nombre d'utilisateurs. Ce fut une année de développement rapide pour Yandex.ru. Le nouveau robot de recherche a permis d'optimiser et d'accélérer l'exploration des sites Runet. Aujourd'hui, la base de recherche de Yandex.ru est deux fois plus grande que celle de ses concurrents les plus proches. Le nouveau robot a permis d'offrir de nouvelles opportunités aux utilisateurs - recherche dans différentes zones de texte (titres, liens, annotations, adresses, légendes d'images), limitation de la recherche à un groupe de sites, recherche par liens et images, et aussi surligner des documents en russe. Une recherche dans les catégories du catalogue est apparue et pour la première fois dans Runet, le concept « d'index de citation » a été introduit - le nombre de ressources référençant une ressource donnée.

Quelle que soit la forme sous laquelle vous avez utilisé le mot dans la requête, la recherche prend en compte toutes ses formes selon les règles de la langue russe. Cependant, la recherche ne se limite pas aux mots ou aux expressions. Yandex trouvera la page Web ou le fichier de l'entreprise avec l'image souhaitée par son nom.

3.4 Moteur de recherche - Rambler

Riz. 9. Moteur de recherche Rambler

En 1991, un groupe de personnes partageant les mêmes idées est apparu dans la ville de Pushchino, inspiré par le nouvel environnement de communication émergent d'Internet. Dmitri Kryukov, Sergueï Lysakov, Viktor Voronkov, Vladimir Samoilov, Yuri Ershov. Les futurs créateurs de Rambler ont initialement entretenu des équipements radio à l'Institut de biochimie et de physiologie des micro-organismes de l'Académie des sciences de Russie. Un échange de données normal, rapide et efficace est nécessaire à la mise en œuvre des objectifs scientifiques. En 1992, la société a lancé ses propres serveurs FTP et de messagerie. Deux ans plus tard, mon premier serveur www.

C’est une année clé pour le développement du cyberespace russe. C'est cette année-là que Sergueï Lysakov et Dmitri Kryukov décident de développer le premier moteur de recherche russe pour Internet.

A cette époque, deux ou trois moteurs de recherche existaient déjà sur RuNet - mais ils n'ont pas résisté à l'épreuve du temps et ont rapidement disparu. Et Rambler s'est développé et a évolué.

Riz. 10. Moteur de recherche Rambler Top 100

Au printemps 1997, Rambler Top100 est apparu - un classificateur de notation unique qui évalue non seulement la popularité des ressources russes sur la base de données objectives, mais vous permet également d'y accéder en un seul « clic ». Les webmasters ont commencé à travailler avec plus de soin et de réflexion sur leurs sites, s'efforçant d'occuper des positions plus élevées dans le Top100. Le Rambler Top100 est rapidement devenu un baromètre de réseau universel, une norme courante pour les mesures des médias.

Le système de recherche contient des informations sur plus de 12 millions de documents situés sur des serveurs en Russie et dans les pays de la CEI. Rambler traite au moins 500 000 demandes de recherche chaque jour, analysant 48 000 serveurs Web et utilisant plusieurs programmes robotiques fonctionnant simultanément.

La requête peut être constituée d'un ou plusieurs mots séparés par des espaces. Des mots et des expressions russes et anglais peuvent être utilisés. Par défaut, seuls les documents dans lesquels tous les mots que vous avez saisis sont trouvés. Pour rechercher des documents contenant au moins un mot de la requête, utilisez le connecteur logique Ou ou sélectionnez sur la page de requête détaillée : "Mots de requête : quelconques". Pour exclure les documents contenant certains mots, indiquez sur la page de demande détaillée : « Exclure les documents contenant les mots suivants... ».

Rambler peut rechercher des mots sous toutes les formes (par exemple, acide aminé, acide aminé, acide aminé, etc.). Pour qu'un mot apparaisse sous toutes les formes, il doit être précédé d'un symbole de service "#" . Dans le menu de requête détaillé, ce mode peut être activé pour tous les mots : « Extension de la requête : toutes les formes de mots ». Symbole de service "@" avant un mot permet de retrouver non seulement le mot lui-même, mais aussi les mots ayant la même racine. Dans le menu de demande détaillée, le symbole "@" correspond au mode "Extension des requêtes : tous les apparentés".

Par défaut, notre système recherche les mots de requête au fur et à mesure que vous les avez saisis afin de réduire le « bruit » dans les documents trouvés. Si vous ne vous souvenez plus comment épeler un mot ou si vous souhaitez développer la requête, vous pouvez utiliser des métacaractères "*" Et "?" pour désigner une partie arbitraire d'un mot et un symbole arbitraire.

Vous pouvez limiter la recherche à des parties de documents, telles que le nom du document, son titre, son URL, etc., via le menu de requête détaillé « Rechercher dans... ».

Vous pouvez limiter la recherche aux documents uniquement en russe ou uniquement en anglais. Pour ce faire, vous devez sélectionner le mode approprié dans le menu de requête détaillée « Langue du document… ». Par défaut, la recherche est effectuée sur les documents dans toutes les langues.

Par défaut, les documents trouvés sont triés par pertinence. Cependant, vous pouvez demander que les plus récents soient placés en haut de la liste. Pour ce faire, sélectionnez le paramètre approprié dans le menu "Trier par..." sur la page de demande détaillée.

Vous pouvez également limiter votre recherche aux documents créés pendant une période précise : pour cela, vous devez préciser « De la date... à ce jour... » sur la page de demande détaillée. Vous pouvez exiger que Rambler renvoie uniquement les documents dans lesquels les mots de la demande sont à une distance minimale les uns des autres. Le mode "Limiter la distance entre les mots" peut être activé dans une requête détaillée. Toutes les règles énumérées ci-dessus peuvent être utilisées ensemble dans l'ordre souhaité. Par défaut, les résultats de la recherche sont renvoyés par lots de 15 documents. Le menu "Sortie par..." de la page de demande détaillée permet d'augmenter ce nombre à 30 ou 50. Le menu "Formulaire de sortie..." permet de recevoir des descriptions de documents avec un niveau de détail augmenté ou diminué.

3.5 Moteur de recherche - Yahoo

Riz. 11. Moteur de recherche Yahoo

Yahoo! - le moteur de recherche le plus connu. Ses sites sont organisés par catégories et mots-clés. Il contient des informations utiles sur sa page d'accueil. Peut se connecter à d’autres moteurs de recherche.

Le service est chargé de rechercher des ressources Internet, des actualités, des cartes, des informations publicitaires, des informations sportives, des entreprises, des numéros de téléphone, des pages WWW personnelles et des adresses e-mail.

Le répertoire principal contient : des adresses (URL) de ressources Internet et une brève description de ces liens. Recherche : toutes les pages Yahoo offrent non seulement un simple champ de recherche, mais également des options pour cette recherche, ainsi que la recherche d'adresses Usenet ou e-mail. La recherche peut se limiter à spécifier une certaine période de temps. Les opérateurs booléens (et, ou) et la recherche séquentielle sont également pris en charge. Si Yahoo! ne parvient pas à établir une connexion assez rapidement avec AltaVista, alors Yahoo! fournira une page de contact avec un ensemble d’outils de recherche. Une fois l'un de ces liens sélectionné, les mots-clés sont transmis au moteur de recherche de votre choix.

Un outil qui facilite la recherche est la présence de « tip search » (TS) - recherche à l'aide d'un « indice » : Yahoo! Il s'agit d'un répertoire subordonné, ce qui signifie que le système n'a pas autant de pages que les moteurs de recherche, mais préciser les mots-clés les plus généraux permettra de trouver le sujet nécessaire sur la page de haut niveau (la première page qui apparaît devant l'utilisateur lors de la visite du site) pour une organisation ou une entreprise.

Les relations sont affichées selon l'ordre des mots spécifiés par la séquence de recherche, ainsi que leur texte descriptif et leur hiérarchie subordonnée.

3.6 Recherche par adresses (par URL)

Vous pouvez rechercher des documents non seulement sur l'Internet en langue russe, mais également dans certaines parties de celui-ci. Le cas le plus simple est la recherche sur un serveur spécifique. Par exemple : url=www.intel.ru chien.

Cette requête trouvera tous les documents sur le serveur www.intel.ru contenant le mot « chien ». Vous vous demandez peut-être ce qui se passera si vous écrivez simplement : url=www.intel.ru.

Dans ce cas, vous recevrez une liste de tous les documents situés sur le serveur que vous avez spécifié. Vous pouvez limiter encore plus la recherche - à l'un des répertoires du serveur. Par exemple : url=www.intel.ru/sobaki/ Saint Bernard.

Pour cette requête, les documents contenant le mot « St. Bernard » seront recherchés uniquement dans le répertoire /sobaki (et ses sous-répertoires) du serveur de Moscou d'Intel Corporation.

Principales caractéristiques des moteurs de recherche russes


www.rambler.ru<#"607685.files/image012.gif">

Figure 13. Moteur de recherche Google

Tout d’abord, vous devez décider exactement ce que vous voulez trouver. Par exemple, par le mot bottes en feutre il y a 131 000 mille pages. À la demande, acheter des bottes en feutre en gros à Souzdal, seulement 259 pages. Si vous recherchez une phrase ou une citation, mettez-la entre guillemets. Vous n'êtes pas obligé de saisir l'intégralité de la demande, mais sélectionnez-la parmi les invites qui s'affichent.

Riz. 14.

Pour voir la réponse directement dans les résultats de recherche, composez immédiatement la question comme réponse. Par exemple, population de Saint-Pétersbourg :

Ou Catherine la Grande est née :


Vous pouvez rechercher non seulement des textes, mais aussi des images :

Vous pouvez également rechercher des vidéos, des cartes, des actualités,... Dans le menu de recherche avancée, vous pouvez paramétrer la recherche d'informations uniquement dans une langue spécifique :

Dans un certain format, par exemple uniquement des présentations ou sur un site Web spécifique.

5. Sauvegarde des informations sur Internet

Internet est comme une immense bibliothèque. Il contient de nombreux sites Internet constitués de pages.

A l'aide d'un ordinateur et des programmes installés dessus, il est possible de se connecter à Internet afin de visualiser les informations qui y sont stockées : textes, images, photographies, musiques, films, et également de les enregistrer sur votre disque.

Les pages Internet ne sont pas stockées sur votre ordinateur. Il s'agit simplement d'une « fenêtre » à travers laquelle vous parcourez les sites Web.

Si des erreurs surviennent lors de la saisie des informations, ce n’est pas grave. Il est impossible de gâcher ou de modifier quoi que ce soit sur Internet depuis votre ordinateur. Si vous fermez la page souhaitée, vous pouvez toujours la rouvrir sous sa forme précédente en cliquant sur le bouton « Retour » ou en ressaisissant son adresse.

Vous pouvez passer d'une page à une autre à l'aide de liens - généralement les liens sont soulignés et surlignés en couleur.

Lorsque le pointeur de la souris passe d'une flèche à une icône en forme de main, cela signifie qu'il survole un lien. Parfois, le lien est une image. Cliquez simplement une fois sur le lien avec le bouton gauche de la souris et une nouvelle page s'ouvrira.

Certains sites vous permettent également d'envoyer des e-mails, des messages instantanés, de publier des photos et de rédiger des journaux.

Internet est le moyen le plus simple de communiquer avec des amis et des collègues partout dans le monde.

Internet contient de nombreux sites sur une variété de sujets.

Conclusion

Avec le développement d'INTERNET, il est devenu possible de rechercher rapidement et facilement les informations documentaires nécessaires. Désormais, vous n’avez plus besoin de sélectionner et d’étudier une énorme quantité de littérature dans les librairies et les bibliothèques.

Les informations peuvent être obtenues sans quitter votre domicile ou votre bureau. Pour ce faire, vous n'avez besoin que de l'ordinateur lui-même, connecté à INTERNET avec un programme spécial installé - un navigateur conçu pour visualiser le contenu des pages Web.

Grâce à la variété des moteurs de recherche spécialement conçus pour l'utilisateur moyen, chacun peut facilement couper le flux d'informations manifestement inutile, uniquement en formulant correctement le but de la recherche.

En complétant le cours, nous pouvons conclure qu'Internet stocke une très grande quantité d'informations pédagogiques sur divers sujets sous forme d'articles dans des journaux électroniques, de rapports, d'ouvrages de référence, d'images graphiques, de fichiers audio et vidéo, et bien plus encore. .

Il existe différentes méthodes de recherche d'informations pédagogiques sur Internet : recherche par liens hypertextes, utilisation de moteurs de recherche, recherche à l'aide d'outils spécifiques, analyse de nouvelles ressources.

Les moteurs de recherche que j'ai examinés sont loin d'être parfaits. On pense qu'un moteur de recherche idéal doit répondre aux exigences suivantes :

Facile à utiliser

Index clairement organisé et mis à jour.

Recherche rapide dans la base de données et réponse rapide.

Fiabilité et précision des résultats de recherche.

L'ampleur des ressources d'information et leur nombre sont en constante expansion. Il devient évident que la base de données n'est pas parfaite. Les agents intelligents constituent une nouvelle tendance qui sous-tend une nouvelle génération de moteurs de recherche capables de filtrer les informations et d'obtenir des résultats plus précis. Internet continue de se développer avec une intensité constante, effaçant essentiellement les restrictions sur la distribution et la réception de l'information dans le monde. Cependant, dans cet océan d'informations, il n'est pas très facile de trouver le document nécessaire ; il faut également garder à l'esprit qu'à côté des serveurs anciens, de nouveaux apparaissent sur le réseau.

Les systèmes d'information dans lesquels le stockage et le traitement des informations sont effectués à l'aide de la technologie informatique sont appelés activités automatisées, divers types et branches de l'industrie des technologies de l'information qui se développent le plus rapidement.

Liste de la littérature utilisée

1. Atelier sur l'informatique : Proc. allocation / Éd. Kournosova A.P. - Voronej : VSAU, 2004. -239 p.

Kroupnik A.B. Recherche Internet : tutoriel. - 2e éd. - Saint-Pétersbourg : Peter, 2004. - 572 p.

Orlov A.A. Programmes nécessaires pour Internet - Saint-Pétersbourg : Peter, 2006. - 127 p.

Solonitsyn Yu.A., Kholmogorov V. Internet. Encyclopédie. - 3ème de. - Saint-Pétersbourg : Peter, 2003. - 592 p.

Réseaux informatiques et outils de sécurité de l'information : manuel. manuel / Kamalyan A.K., Kulev S.A., Nazarenko K.N. et autres - Voronej : VSAU, 2003. - 119 p.

Popov V. Atelier sur les technologies Internet : Cours de formation / V. Popov.-SPb.; M. ; Kharkov; Minsk : Peter, 2002. - 476 pp. : ill.

Réseaux informatiques et outils de sécurité de l'information : Manuel / Kamalyan A.K., Kulev S.A., Nazarenko K.N. et autres - Voronej : VSAU, 2003. - 119 p.

Fondamentaux des technologies informatiques modernes. Éd. Khomonenko A.D. - Tirage de la Couronne, Saint-Pétersbourg 1998.

Ordinateurs personnels sur réseaux TCP/IP. Craig Chasse ; traduction De l'anglais - BHV-Kyiv, 1997.

Pavel Khramtsov "Recherche et navigation sur Internet".://www.osp.ru/cw/1996/20/31.htm

Formation aux métiers de l'Internet. Expert en moteurs de recherche.://searchengine.narod.ru/archiv/se_2_250500.htm

Andrey Alikberov "Quelques mots sur le fonctionnement des robots des moteurs de recherche."://www.citforum.ru/internet/search/art_1.shtml

1. L'organisateur de la diffusion d'informations sur Internet est une personne exerçant des activités visant à assurer le fonctionnement de systèmes d'information et (ou) de programmes pour ordinateurs électroniques destinés et (ou) utilisés à la réception, à la transmission, à la livraison et (ou ) traitement des messages électroniques des internautes.

2. L'organisateur de la diffusion d'informations sur Internet est tenu, de la manière établie par le gouvernement de la Fédération de Russie, d'informer l'organe exécutif fédéral exerçant des fonctions de contrôle et de surveillance dans le domaine des médias, des communications de masse, des technologies de l'information et communications, sur le début des activités spécifiées dans la partie 1 de cet article.

3. L'organisateur de la diffusion d'informations sur Internet est tenu de stocker sur le territoire de la Fédération de Russie :

1) des informations sur les faits de réception, de transmission, de livraison et (ou) de traitement d'informations vocales, de textes écrits, d'images, de sons, de vidéos ou d'autres messages électroniques d'utilisateurs d'Internet et d'informations sur ces utilisateurs dans un délai d'un an à compter de la date d'achèvement de de telles actions ;

2) les messages texte des internautes, informations vocales, images, sons, vidéo et autres messages électroniques des internautes jusqu'à six mois à compter de la fin de leur réception, transmission, livraison et (ou) traitement. La procédure, les modalités et le volume de stockage des informations spécifiées dans le présent alinéa sont établis par le gouvernement de la Fédération de Russie.

3.1. L'organisateur de la diffusion d'informations sur Internet est tenu de fournir les informations spécifiées dans la partie 3 du présent article aux organismes publics autorisés exerçant des activités de renseignement opérationnel ou assurant la sécurité de la Fédération de Russie, dans les cas établis par les lois fédérales.

(voir texte dans l'édition précédente)

4. L'organisateur de la diffusion d'informations sur Internet est tenu d'assurer la mise en œuvre des exigences relatives aux équipements, logiciels et matériels utilisés par l'organisateur spécifié dans les systèmes d'information qu'il exploite, pour ces organismes, dans les cas établis par les lois fédérales. , mener des activités afin de mettre en œuvre les tâches qui leur sont assignées, ainsi que prendre des mesures pour empêcher la divulgation des méthodes organisationnelles et tactiques pour mener à bien ces activités. La procédure d'interaction entre les organisateurs de la diffusion d'informations sur Internet et les organismes gouvernementaux autorisés exerçant des activités de renseignement opérationnel ou assurant la sécurité de la Fédération de Russie est établie par le gouvernement de la Fédération de Russie.

4.1. L'organisateur de la diffusion d'informations sur Internet est tenu, lorsqu'il utilise un codage supplémentaire de messages électroniques, de recevoir, de transmettre, de transmettre et (ou) de traiter des messages électroniques des internautes et (ou) lorsqu'il offre aux utilisateurs d'Internet la possibilité d'un codage supplémentaire des messages électroniques, pour fournir à l'organe exécutif fédéral dans le domaine de la sécurité, les informations nécessaires au décodage des messages électroniques reçus, transmis, livrés et (ou) traités.

4.2. L'organisateur de la diffusion d'informations sur Internet en cas de réalisation d'activités visant à assurer le fonctionnement de systèmes d'information et (ou) de programmes pour ordinateurs électroniques destinés et (ou) utilisés à l'échange de messages électroniques exclusivement entre utilisateurs de ces systèmes d'information et (ou) programmes pour ordinateurs électroniques, dans lesquels l'expéditeur du message électronique détermine le ou les destinataires du message électronique, ne prévoient pas le placement par les internautes d'informations accessibles au public sur Internet et la transmission de messages électroniques à un nombre indéterminé de personnes (ci-après dénommé l'organisateur du service de messagerie instantanée), est également tenu :

1) identifier les internautes dont la transmission des messages électroniques est effectuée par l'organisateur du service de messagerie instantanée (ci-après dénommés les utilisateurs du service de messagerie instantanée), par le numéro d'abonné de l'opérateur de radiotéléphonie mobile de la manière établie par le Gouvernement de la Fédération de Russie, sur la base d'un accord d'identification conclu par l'organisateur du service de messagerie instantanée avec l'opérateur de radiotéléphonie mobile, à l'exception des cas prévus par la présente loi fédérale ;

2) dans les 24 heures à compter de la réception de la demande correspondante de l'organe exécutif fédéral autorisé, limiter la capacité de l'utilisateur du service de messagerie instantanée spécifié dans la présente exigence à transmettre des messages électroniques contenant des informations dont la distribution est interdite dans le Fédération de Russie, ainsi que les informations diffusées en violation des exigences de la législation de la Fédération de Russie, de la manière déterminée par le gouvernement de la Fédération de Russie ;

3) offrir la possibilité technique aux utilisateurs du service de messagerie instantanée de refuser de recevoir des messages électroniques d'autres utilisateurs ;

4) assurer la confidentialité des messages électroniques transmis ;

5) assurer la possibilité de transmettre des messages électroniques à l'initiative des organismes gouvernementaux conformément à la législation de la Fédération de Russie ;

6) empêcher la transmission de messages électroniques aux utilisateurs du service de messagerie instantanée dans les cas et de la manière déterminés par le gouvernement de la Fédération de Russie.

4.3. L'organisateur du service de messagerie instantanée, qui est une personne morale russe ou un citoyen de la Fédération de Russie, a le droit d'identifier de manière indépendante les utilisateurs du service de messagerie instantanée en déterminant le numéro d'abonné radiotéléphonique mobile de l'utilisateur du service de messagerie instantanée. Le gouvernement de la Fédération de Russie peut établir des exigences concernant la procédure de détermination du numéro d'abonné d'une communication radiotéléphonique mobile d'un utilisateur d'un service de messagerie instantanée par un organisateur d'un service de messagerie instantanée qui est une personne morale russe ou un citoyen de la Fédération de Russie. Fédération.

4.4. L'organisateur du service de messagerie instantanée, qui est une personne morale russe ou un citoyen de la Fédération de Russie, est tenu de stocker des informations sur l'identification du numéro d'abonné de la communication radiotéléphonique mobile de l'utilisateur du service de messagerie instantanée (ci-après dénommé comme informations d'identification sur le numéro d'abonné) uniquement sur le territoire de la Fédération de Russie. La fourniture d'informations d'identification sur un numéro d'abonné à des tiers ne peut être effectuée qu'avec le consentement de l'utilisateur du service de messagerie instantanée, à l'exception des cas prévus par la présente loi fédérale et d'autres lois fédérales. L'obligation de justifier de l'obtention du consentement de l'utilisateur du service de messagerie instantanée pour fournir à des tiers des informations d'identification sur le numéro d'abonné de cet utilisateur du service de messagerie instantanée incombe à l'organisateur du service de messagerie instantanée.

Le centre de données stocke absolument toutes les informations publiées sur le réseau. Il s'agit de vos photos personnelles, documents téléchargés, enregistrements de conversations Skype, commentaires sur les blogs et autres données importantes et sans importance. Essentiellement, un centre de données est une grande banque, un référentiel de contenu. En créant de telles installations de stockage, les développeurs ont poursuivi plusieurs objectifs : disponibilité 24 heures sur 24, protection des accès, préservation des informations et intégrité des fichiers.

Puisque des informations précieuses existent, il y aura certainement ceux qui voudront les voler. Ce ne sont pas les militaires ou les soldats qui sont responsables de la sécurité des centres de données, mais des agents de sécurité de haute technologie hautement intelligents travaillant sous le regard de systèmes de vidéosurveillance et de contrôle. Le devoir des agents de sécurité est d’assurer la confidentialité et l’intégrité totale du contenu.

Conditions techniques du centre de données

Il existe des règles strictes régissant le fonctionnement des centres de données. Les entreprises doivent bénéficier d’un électricité ininterrompu. Les centres de données de niveau 4 (quatrième niveau) reçoivent l'énergie de deux centrales électriques à la fois. Une telle double assurance est nécessaire afin d'éliminer la possibilité d'une panne de courant en cas de panne de l'une des centrales électriques.

Les centres de données sont équipés de systèmes modernes d'extinction d'incendie à gaz. Les systèmes d'extinction d'incendie à gaz permettent de remplir la source d'inflammation avec de la poudre de dioxyde de carbone pour éviter d'endommager d'autres équipements. La poudre de dioxyde de carbone est traditionnellement utilisée dans les extincteurs pour éteindre les équipements électriquement connectés.

Une grande attention est accordée à la climatisation. Pendant le fonctionnement, les disques durs et les serveurs génèrent de la chaleur, qui est évacuée à l'aide de systèmes de climatisation et de ventilation. En été, l'air frais filtré de la rue est utilisé la nuit ; en hiver, l'air glacial est mélangé à l'air chaud de l'intérieur.

Comment les « dépositaires d’informations » gagnent-ils de l’argent ?

Les centres de données fonctionnent sur une base commerciale. Ils louent de l'espace sur le stockage réseau ou sur des disques durs. Si vous le souhaitez, vous pouvez louer un serveur entier, un espace rack pour votre propre serveur ou louer un box. Dans ce dernier cas, le coût de l'électricité s'ajoute au prix de location (avec une petite majoration).

Récemment, un service tel que la location d'un logiciel a gagné en popularité. Les centres de données achètent des programmes sous licence, les installent sur leurs serveurs et les louent en partie. Un autre service populaire consiste à louer un serveur virtuel, c'est-à-dire une certaine part des ressources du serveur.

Voici une liste de services de stockage d'informations en ligne que je connais :

Il est possible de synchroniser un dossier avec le serveur et différents ordinateurs, ce qui est pratique lorsqu'on utilise plusieurs ordinateurs. Pour synchroniser, vous devez installer le programme Yandex.Disk sur votre ordinateur - il créera un dossier qui sera synchronisé. De plus, l'installation de ce programme augmente le volume initial du disque, mais vous pouvez ensuite le supprimer et il deviendra votre stockage de fichiers externe. D'ailleurs, si vous créez vous-même un Disque en utilisant mes liens, vous recevrez un volume supplémentaire de 1 Go, et je recevrai 0,5 Go ( à condition d'installer le programme sur votre ordinateur) - c'est ainsi que Yandex fait la promotion de son référentiel. J'utilise déjà ce service, c'est très pratique, je le recommande !

3. Fichiers QIP – http://file.qip.ru. Stockage gratuit de 2 Go d'espace libre pour des fichiers de tout type pendant une période de 30 jours. Pour prolonger la période, vous devez télécharger le fichier au moins une fois. Pour augmenter la durée et le volume des informations stockées, il existe des comptes premium payants dans lesquels vous recevrez 100 Go d'espace pour 25 $. Pour accéder au service, vous devez disposer d'un compte QIP et pour télécharger directement depuis votre client QIP, vous devez installer QIP-Infium. C’est également une opportunité pratique d’accéder à distance aux informations depuis n’importe où dans le monde. Le service a cessé de fonctionner

4. Fichiers ex.ua – Service ukrainien GRATUIT pour stocker un VOLUME ILLIMITÉ d’informations. Les fichiers peuvent être de N’IMPORTE QUELLE taille et N’IMPORTE QUEL format. Pour y accéder, allez simplement sur la page du service et cliquez sur le bouton Créer, téléchargez vos données et notez la clé et le lien pour accéder à vos données. Le système lui-même mémorise votre ordinateur et, par la suite, uniquement à partir de celui-ci, vous pouvez modifier ou supprimer vos informations. Avec le lien, vous pouvez y accéder de n'importe où. La durée de conservation est limitée à 30 jours. Pour renouveler, téléchargez simplement vos fichiers une fois. Service très simple et pratique !

9. C'est aussi un moyen de stocker des informations, et c'est non seulement gratuit, mais aussi rentable. Puisque tous les comptes de partage de fichiers vous appartiennent, vous avez toujours accès à vos informations, dans n'importe quel volume et depuis n'importe quel endroit. Les services de partage de fichiers ont leurs propres limites en termes de volume et de termes et conditions, vous vous familiariserez donc avec eux plus en détail dans chacun d'eux.

C'est ainsi qu'en utilisant l'immensité d'Internet, vous pouvez stocker des fichiers sur Internet, en gardant votre disque dur libre et facile.

P.S. Lisez la suite et vous disposerez de 100 25 Go d'espace absolument gratuit pour stocker des fichiers sur Internet à partir du service mail.ru

Si cet article vous a aidé, aidez également l'auteur - créez un blog et parlez du blog à vos amis en utilisant les boutons sociaux, au cas où vous les aideriez également !

Cordialement, Alexey Gontcharov.

Suivez les boutons, parlez de l'article à vos amis - cela vous rapportera de l'argent !