Nouveaux moteurs de recherche. Moteurs de recherche russes

Ils font depuis longtemps partie intégrante Internet russe. Les moteurs de recherche sont désormais des mécanismes énormes et complexes qui représentent non seulement un outil de recherche d'informations, mais aussi des domaines d'activité tentants.

La plupart des utilisateurs des moteurs de recherche n'ont jamais réfléchi (ou n'y ont pensé, mais n'ont pas trouvé de réponse) au principe de fonctionnement des moteurs de recherche, au schéma de traitement des demandes des utilisateurs, à quoi consistent ces systèmes et comment ils fonctionnent...

Cette master class a pour but de répondre à la question de leur fonctionnement moteurs de recherche. Cependant, vous ne trouverez pas ici de facteurs qui influencent le classement des documents. Et plus encore, il ne faut pas compter sur explication détaillée Algorithme Yandex. Selon Ilya Segalovich, directeur de la technologie et du développement du moteur de recherche Yandex, il ne peut être reconnu "sous la torture" que par Ilya Segalovich lui-même...

2. Concept et fonctions d'un moteur de recherche

Un système de recherche est un complexe logiciel et matériel conçu pour rechercher sur Internet et répondre à une demande de l'utilisateur spécifiée sous la forme d'une phrase textuelle ( requête de recherche), émettant une liste de liens vers des sources d'information, par ordre de pertinence (selon la demande). Les plus grands moteurs de recherche internationaux : "Google", Yahoo , MSN . Sur Internet russe, il s'agit de Yandex, Rambler, Aport.

Examinons de plus près le concept de requête de recherche en utilisant le moteur de recherche Yandex comme exemple. La requête de recherche doit être formulée par l'utilisateur en fonction de ce qu'il souhaite trouver, de la manière la plus brève et la plus simple possible. Disons que nous voulons trouver des informations dans Yandex sur la façon de choisir une voiture. Pour ce faire, ouvrez page d'accueil"Yandex", et entrez le texte de la requête de recherche "comment choisir une voiture". Ensuite, notre tâche consiste à ouvrir les liens fournis à notre demande vers des sources d'informations sur Internet. Cependant, il est fort possible que nous ne trouvions pas les informations dont nous avons besoin. Si cela se produit, soit vous devez reformuler votre demande, soit la base de données du moteur de recherche ne dispose vraiment d'aucune information pertinente sur notre demande (cela peut arriver lorsque vous posez des requêtes très « étroites », comme par exemple « comment choisir une voiture à Arkhangelsk »)

L’objectif principal de tout moteur de recherche est de fournir aux internautes exactement les informations qu’ils recherchent. Et apprendre aux utilisateurs à faire des requêtes « correctes » au système, c'est-à-dire les requêtes respectant les principes de fonctionnement des moteurs de recherche sont impossibles. Par conséquent, les développeurs créent des algorithmes et des principes de fonctionnement pour les moteurs de recherche qui permettraient aux utilisateurs de trouver les informations qu'ils recherchent.

Cela signifie que le moteur de recherche doit « penser » de la même manière que l’utilisateur pense lorsqu’il recherche des informations. Lorsqu'un utilisateur fait une demande à moteur de recherche, il souhaite trouver ce dont il a besoin le plus rapidement et le plus facilement possible. En recevant le résultat, il évalue les performances du système, guidé par plusieurs paramètres de base. A-t-il trouvé ce qu'il cherchait ? S’il ne l’a pas trouvé, combien de fois a-t-il dû reformuler la requête pour trouver ce qu’il cherchait ? Quelle quantité d’informations pertinentes pourrait-il trouver ? À quelle vitesse le moteur de recherche a-t-il traité la requête ? Dans quelle mesure les résultats de recherche ont-ils été présentés ? Le résultat que vous recherchiez était-il le premier ou le centième ? Combien déchets inutiles a été trouvé à égalité avec informations utiles? Les informations nécessaires seront-elles trouvées en accédant à un moteur de recherche, disons, dans une semaine ou dans un mois ?

Afin de répondre à toutes ces questions, les développeurs de moteurs de recherche améliorent constamment les algorithmes et les principes de recherche, ajoutent de nouvelles fonctions et capacités et essaient par tous les moyens d'accélérer le fonctionnement du système.

3. Principales caractéristiques d'un moteur de recherche

Décrivons les principales caractéristiques des moteurs de recherche :

  • exhaustivité

    L'exhaustivité est l'une des principales caractéristiques d'un système de recherche, c'est-à-dire le rapport entre le nombre de documents trouvés sur demande et le nombre total de documents sur Internet qui satisfont cette demande. Par exemple, s'il y a 100 pages sur Internet contenant l'expression « comment choisir une voiture » et que seulement 60 d'entre elles ont été trouvées pour la requête correspondante, alors l'exhaustivité de la recherche sera de 0,6. Évidemment, quoi recherche plus complète, moins il est probable que l'utilisateur ne trouve pas le document dont il a besoin, à condition qu'il existe sur Internet.

  • Précision

    La précision est une autre caractéristique principale d'un moteur de recherche, qui est déterminée par le degré avec lequel les documents trouvés correspondent à la requête de l'utilisateur. Par exemple, si la requête « comment choisir une voiture » contient 100 documents, 50 d'entre eux contiennent l'expression « comment choisir une voiture », et le reste contient simplement ces mots (« comment choisir la bonne radio et l'installer dans une voiture »), alors la précision de la recherche est considérée comme égale à 50/100 (=0,5). Comment recherche plus précise, ceux utilisateur plus rapide trouvera les documents dont il a besoin, moins on trouvera parmi eux de « déchets » divers, moins souvent les documents trouvés ne correspondront pas à la demande.

  • Pertinence

    La pertinence est un élément tout aussi important de la recherche, qui se caractérise par le temps qui s'écoule entre le moment où les documents sont publiés sur Internet jusqu'à leur saisie dans la base de données d'index du moteur de recherche. Par exemple, le lendemain de l'apparition d'une nouvelle intéressante, un grand nombre de les utilisateurs se sont tournés vers les moteurs de recherche avec des requêtes pertinentes. Objectivement, moins d'un jour s'est écoulé depuis la publication d'informations d'actualité sur ce sujet, mais les principaux documents ont déjà été indexés et disponibles pour la recherche, grâce à l'existence de la « base de données rapide » des grands moteurs de recherche, qui est mis à jour plusieurs fois par jour.

  • Vitesse de recherche

    La vitesse de recherche est étroitement liée à sa résistance à la charge. Par exemple, selon Rambler Internet Holding LLC, aujourd'hui, pendant les heures de bureau, le moteur de recherche Rambler reçoit environ 60 requêtes par seconde. Une telle charge de travail nécessite de réduire le temps de traitement d'une demande individuelle. Ici, les intérêts de l'utilisateur et du moteur de recherche coïncident : le visiteur souhaite obtenir des résultats le plus rapidement possible, et le moteur de recherche doit traiter la demande le plus rapidement possible, afin de ne pas ralentir le calcul des requêtes ultérieures.

  • Visibilité

4. Histoire courte développement de moteur de recherche

Au cours de la période initiale de développement d'Internet, le nombre de ses utilisateurs était faible et le volume informations disponibles relativement petit. Pour la plupart, seul le personnel de recherche avait accès à Internet. À cette époque, la tâche de recherche d’informations sur Internet n’était pas aussi urgente qu’aujourd’hui.

L'un des premiers moyens d'organiser l'accès à ressources d'informations Le réseau a commencé à créer des répertoires ouverts de sites, des liens vers des ressources dans lesquels étaient regroupés par sujet. Le premier projet de ce type était le site Web Yahoo.com, ouvert au printemps 1994. Après que le nombre de sites dans l'annuaire ait considérablement augmenté, une fonction de recherche a été ajoutée information nécessaire selon le catalogue. Au sens plein, il ne s'agissait pas encore d'un moteur de recherche, puisque la zone de recherche se limitait aux seules ressources présentes dans le catalogue, et non à toutes les ressources Internet.

Les répertoires de liens étaient largement utilisés dans le passé, mais ils ont presque complètement perdu de leur popularité à l'heure actuelle. Étant donné que même les catalogues modernes, au volume énorme, ne contiennent des informations que sur une partie négligeable d'Internet. Le plus grand répertoire du réseau DMOZ (également appelé Open Directory Project) contient des informations sur 5 millions de ressources, tandis que la base de données de recherche Systèmes Google se compose de plus de 8 milliards de documents.

En 1995, apparaissent les moteurs de recherche Lycos et AltaVista. Ce dernier est leader dans le domaine de la recherche d’informations sur Internet depuis de nombreuses années.

En 1997, Sergey Brin et Larry Page créent le moteur de recherche Google dans le cadre de projet de rechercheà l'Université de Stanford. DANS actuellement Google est le moteur de recherche le plus populaire au monde !

En septembre 1997, le moteur de recherche Yandex, le plus populaire sur Internet en langue russe, a été officiellement annoncé.

Actuellement, il existe trois principaux moteurs de recherche (internationaux) - Google, Yahoo et, qui disposent de leurs propres bases de données et algorithmes de recherche. La plupart des autres moteurs de recherche (qui sont très nombreux) utilisent sous une forme ou une autre les résultats des trois répertoriés. Par exemple, la recherche AOL (search.aol.com) utilise la base de données Google, tandis qu'AltaVista, Lycos et AllTheWeb utilisent la base de données Yahoo.

5. Composition et principes de fonctionnement du système de recherche

En Russie, le principal moteur de recherche est Yandex, suivi de Rambler.ru, Google.ru, Aport.ru, Mail.ru. De plus, sur ce moment, Mail.ru utilise le moteur de recherche et la base de données Yandex.

Presque tous les principaux moteurs de recherche ont leur propre structure, différente des autres. Il est cependant possible d’identifier les principales composantes communes à tous les moteurs de recherche. Les différences de structure ne peuvent prendre la forme que de la mise en œuvre des mécanismes d'interaction de ces composants.

Module d'indexation

Le module d'indexation se compose de trois programmes auxiliaires (robots) :

Spider est un programme conçu pour télécharger des pages Web. L'araignée télécharge la page et récupère tous les liens internes de cette page. Le code html de chaque page est téléchargé. Les robots utilisent pour télécharger des pages Protocoles HTTP. L'araignée fonctionne comme suit. Le robot envoie la requête « get/path/document » et quelques autres commandes de requête HTTP au serveur. En réponse, le robot reçoit un flux de texte contenant des informations sur le service et le document lui-même.

  • L'URL de la page
  • date à laquelle la page a été téléchargée
  • En-tête http de réponse du serveur
  • corps de la page (code html)

Crawler (« araignée voyageuse ») est un programme qui suit automatiquement tous les liens trouvés sur la page. Sélectionne tous les liens présents sur la page. Son travail consiste à déterminer où l'araignée doit aller ensuite, sur la base de liens ou d'une liste d'adresses prédéterminée. Crawler, en suivant les liens trouvés, recherche de nouveaux documents encore inconnus du moteur de recherche.

Indexer (robot indexeur) est un programme qui analyse les pages Web téléchargées par les araignées. L'indexeur analyse la page en ses composants et les analyse à l'aide de ses propres algorithmes lexicaux et morphologiques. Sont soumis à analyse divers éléments pages, telles que le texte, les titres, les liens, les caractéristiques structurelles et de style, les balises HTML de service spécial, etc.

Ainsi, le module d'indexation permet d'explorer un ensemble donné de ressources à l'aide de liens, de télécharger les pages rencontrées, d'extraire des liens vers de nouvelles pages à partir des documents reçus et d'effectuer une analyse complète de ces documents.

Base de données

Une base de données, ou index d'un moteur de recherche, est un système de stockage de données, un tableau d'informations dans lequel sont stockés les paramètres spécialement convertis de tous les documents téléchargés et traités par le module d'indexation.

Serveur de recherche

Le serveur de recherche est l'élément le plus important l'ensemble du système, puisque la qualité et la rapidité de la recherche dépendent directement des algorithmes qui sous-tendent son fonctionnement.

Le serveur de recherche fonctionne comme suit :

  • La demande reçue de l'utilisateur est soumise à une analyse morphologique. Généré environnement informationnel chaque document contenu dans la base de données (qui sera ensuite affiché sous la forme, c'est-à-dire correspondant à la demande informations textuelles sur la page des résultats de recherche).
  • Les données reçues sont transmises comme paramètres d'entrée à un module de classement spécial. Les données sont traitées pour tous les documents, de sorte que chaque document dispose de sa propre notation qui caractérise la pertinence de la requête saisie par l'utilisateur et les différents éléments de ce document stockés dans l'index du moteur de recherche.
  • Selon le choix de l'utilisateur, cette note pourra être ajustée conditions additionnelles(par exemple, ce qu'on appelle la « recherche avancée »).
  • Ensuite, un extrait est généré, c'est-à-dire que pour chaque document trouvé, le titre, un court résumé qui correspond le mieux à la requête et un lien vers le document lui-même sont extraits de la table des documents, et les mots trouvés sont mis en surbrillance.
  • Les résultats de recherche résultants sont transmis à l’utilisateur sous la forme d’une SERP (Search Engine Result Page) – une page de résultats de recherche.

Comme vous pouvez le constater, tous ces composants sont étroitement liés les uns aux autres et fonctionnent en interaction, formant un mécanisme clair et plutôt complexe pour le fonctionnement du système de recherche, qui nécessite d'énormes quantités de ressources.

6. Conclusion

Résumons maintenant tout ce qui précède.

  • L’objectif principal de tout moteur de recherche est de fournir aux internautes exactement les informations qu’ils recherchent.
  • Principales caractéristiques des moteurs de recherche :
    1. exhaustivité
    2. Précision
    3. Pertinence
    4. Vitesse de recherche
    5. Visibilité
  • Le premier moteur de recherche à part entière fut le projet WebCrawler, publié en 1994.
  • Le système de recherche comprend les composants suivants :
    1. Module d'indexation
    2. Base de données
    3. Serveur de recherche

Nous espérons que notre master class vous permettra de vous familiariser davantage avec le concept de moteur de recherche et de mieux comprendre les principales fonctions, caractéristiques et principes de fonctionnement des moteurs de recherche.

Dans cet article, vous trouverez un aperçu des moteurs de recherche russes - développements nationaux et moteurs de recherche mondiaux adaptés à RuNet. Faisons une petite note à partir de la liste des moteurs de recherche en Russie.

Histoire des moteurs de recherche dans le monde et en Russie

Tout a bien sûr commencé avec des sites Web et des annuaires de sites Web qui systématisaient les informations les concernant. Mais il y avait de plus en plus de sites, et il n'était pas clair comment afficher rapidement les résultats de recherche sur plusieurs sites et les comparer afin d'obtenir un résultat de la plus haute qualité en réponse à la question. Ce problème se pose petit à petit depuis l’avènement d’Internet.

Mais la condition préalable à l'apparition systèmes mondiaux la recherche d'informations sur Internet existe depuis longtemps - à mesure que le nombre de sites augmente géométriquement et que les sites apparaissent dans des langues régionales autres que l'anglais. De plus, non seulement le nombre total de sites a augmenté, mais le nombre de pages sur chacun d'eux a également augmenté. Par conséquent, un système automatisé d’indexation et de classement était nécessaire.

Eh bien, avec l'augmentation du nombre d'internautes dans le monde à plus de 3 milliards, la demande et la popularité des moteurs de recherche ont augmenté. Vous devez d’une manière ou d’une autre naviguer dans cette mer d’informations dans « World Wide Web».

C'est ainsi qu'est apparu le premier moteur de recherche Altavista, puis Yahoo, Google et autres.

Liste des moteurs de recherche sur Internet mondial

Il existe actuellement de nombreux moteurs de recherche sur l'Internet international, dont le leader est Google américain.

Liste des moteurs de recherche mondiaux en ordre alphabétique:

  1. Baidu ;
  2. Bing ;
  3. CanardDuckGo ;
  4. Gigablast ;
  5. Recherche Google;
  6. Soso.com ;
  7. Page de démarrage (Ixquick);
  8. OuiCy ;
  9. Yahoo! Recherche;
  10. Recherche Yandex.

Dans le contexte de la domination globale du moteur de recherche Google, adapté à de nombreuses langues locales et intégré par défaut à tous les smartphones Android, d'autres acteurs du marché tentent d'introduire de nouvelles fonctionnalités pour les utilisateurs ou de profiter d'autres opportunités pour leur promotion.

Par exemple, DuckDuckGo se soucie de la confidentialité et de la sécurité des données de ses utilisateurs (il ne les surveille pas et ne vend pas ces informations à des tiers), et Bing de Microsoft est présenté comme un moteur de recherche intégré dans Navigateur Edge Systèmes d'exploitation Windows 10.

Depuis l’apparition des premiers moteurs de recherche, nombre d’entre eux ont déjà cessé d’exister. D'autres ont été consommés. Yahoo est généralement devenue une entreprise diversifiée dont les revenus importants ne provenaient pas de la recherche, mais d'investissements dans les services Internet et les startups.

Il est désormais probablement impossible d’accéder à ce marché sans investir massivement dans le marketing, la science et la technologie. Après tout, derrière la ligne de saisie minimaliste des requêtes de recherche se cache un mécanisme à forte intensité de ressources et de capitaux, des milliers d'employés et des centaines de milliers d'heures de travail déjà investies dans les moteurs de recherche dans un passé récent.

Et même dans ce cas, les utilisateurs sont très inertes et ont déjà formé des préférences de recherche difficiles à modifier. Un exemple en est les tentatives infructueuses de Microsoft pour prendre une part significative des recherches sur les PC. À bien des égards, cette situation est due à l'impopularité des navigateurs MS parmi les utilisateurs.

Donc utilisateurs ordinaires Il ne reste plus qu'à choisir le meilleur service de recherche pour vous-même, et également à attendre une consolidation et une monopolisation encore plus importantes des moteurs de recherche existants, ou l'émergence de nouvelles startups dans ce domaine.

Principaux moteurs de recherche dans RuNet

Sur marché russe Depuis plus d'une décennie, la situation de domination de Yandex persiste, perdant progressivement sa part sous les fortes assauts du dur Google. En fait, ces deux acteurs sont les principaux moteurs de recherche dominants sur RuNet. Il ne sera pas possible de construire une notation, car pour le moment la division du marché est proche de 50/50.

Note! La promotion sous Yandex est différente de la promotion sous Google. Comment promouvoir un site Web dans Yandex - .

Google est arrivé en Russie en 2004 et depuis lors, pourcentage après pourcentage, il a enlevé le leadership au moteur de recherche russe Yandex, mais il ne l'a toujours pas enlevé. Cette situation n’est pas unique sur le marché mondial : il existe au moins deux autres pays dans lesquels le moteur de recherche de Google a rencontré une sérieuse résistance : la République tchèque et la Chine (RPC).

Afin d'avoir une idée rapide du marché de la recherche sur RuNet, suivez le lien https://www.liveinternet.ru/stat/ru/searches.html?period=month;total=yes

Après que le PS ait été fermé aux compteurs des autres Expressions-clés, Les statistiques Liveinternet ont conservé leur valeur ne serait-ce que parce qu'elles comptent les transitions des recherches Yandex et Google. Et voici ce que nous constatons :

Et sur une période de 2 ans, un rétrécissement de l'écart est bien visible : Google rattrape son retard et contre-attaque le moteur de recherche russe.

Mais comment est-ce possible ? Très simple. Vous vous souvenez probablement que les développeurs front-end modernes adhèrent au principe du « mobile first » ? Et ce n’est pas sans raison : Internet passe très facilement de l’ordinateur de bureau au mobile.

Qu'avons-nous sur nos smartphones et nos tablettes ? C'est vrai, Android. Quelle recherche est installée par défaut sur Android ? C'est vrai, recherche Google.

C'est ça. Si la startup Android avait été rachetée par Samsung et non par Google, tout aurait pu être différent.

En revenant à RuNet et aux moteurs de recherche, on ne peut s'empêcher de constater la baisse progressive de la part des recherches sur Mail.ru, flottant autour de 5 à 6 %. Il est utilisé par les visiteurs des sites Web du groupe Mail.ru.

Il existe également des moteurs de recherche dits de second rang : Rambler, Nigma. Même s'il serait plus correct de ne pas en tenir compte du tout. Rambler (en tant qu'entreprise) a eu de nombreux problèmes de gestion et la recherche Rambler « est morte » avec le temps, incapable de faire face à la concurrence marketing et à la course technologique. Nygma, à son tour, n'a jamais décollé - probablement parce que les internautes russes avaient déjà pris des habitudes et des préférences.

Ainsi, au cours des 10-15 années de formation du Runet « recherche », Yandex a perdu le titre de leader inconditionnel et inconditionnel et rivalise désormais sur un pied d'égalité avec le géant américain : perdre quelque part, gagner quelque part.

De plus, la tendance est clairement à la baisse. Mais voyons, en 2016, personne ne sait ce que Yandex est prêt à faire pour conserver sa part de recherche. Peut-être s'agira-t-il d'une concurrence de haute technologie, ou peut-être d'une ressource administrative tout aussi impitoyable - Yandex tâte déjà le terrain, ayant récemment intenté une action en justice contre Google devant le FAS et gagné le procès. Qui sait, peut-être que Roskomnadzor bloquera Google sur le territoire de la Fédération de Russie 😀 Bien sûr, rien de drôle, mais je ne suis plus sûr de rien.

Marchés des moteurs de recherche sur Internet mondial

Passant du marché russe au marché mondial, je noterai simplement qu’il n’y a rien d’intéressant là-bas. La domination presque illimitée de Google. Bien sûr, il existe des situations intéressantes sur les marchés locaux, et je vais vous en parler.

Turquie. Yandex est entré sur le marché turc il y a 5 ans et s'est fixé en 2016 à environ 5 à 7 %.

Chine. Baidu domine, le gouvernement chinois protège fortement le marché local. Et même un Occidental ne peut pas comprendre les hiéroglyphes sans bouteille - une telle caractéristique du marché local affecte toujours la qualité de la recherche.

CEI. Yandex est également à peu près à égalité avec Google, perdant un peu à certains endroits et gagnant un peu à d'autres. La tendance à la baisse est plus marquée que sur le marché russe.

ETATS-UNIS. Le marché américain reste traditionnellement le lieu où d'autres grandes STN - Microsoft, AOL, Yahoo - sont prêtes à « frapper Google au visage », en utilisant toutes les ressources possibles. Ce n’est pas une petite chose non compétitive à laquelle on ne peut résister. Il n’est pas surprenant que la part de Google ne constitue pas un monopole, mais dépasse à peine 60 à 62 % en 2016.

Bing de Microsoft connaît une croissance constante et l'entreprise elle-même comprend l'importance de l'écosystème et rattrape Android. Ils ont acheté Nokia et produisent des smartphones avec Windows intégré, déploient un nouveau système d'exploitation pour les ordinateurs de bureau et les tablettes et font la promotion du navigateur Edge pratique. Les gens travaillent. Yahoo n'abandonne pas non plus.

C’est probablement tout ce qu’on peut dire des moteurs de recherche en Russie et dans la CEI, sur l’Internet mondial. Les plus populaires d'entre eux sont connus et occupent fermement leur place dans le classement mondial des services de recherche pratiques pour les internautes.

Cet article est pertinent pour 2016 et le temps nous dira qui deviendra le nouveau roi de la colline en Russie et dans le monde, et qui quittera le marché. Les utilisateurs n'ont d'autre choix que de regarder, de voter avec leurs roubles et leurs pieds. C'est-à-dire avec vos mains.

Les meilleurs moteurs de recherche Internet. Moteur de recherche Internet Ce programmes spéciaux pour la recherche, installé sur tout le complexe machines spécialisées. En termes simples, il s'agit du même site Web avec un ensemble de programmes, uniquement sur un moteur de recherche spécial (serveur). C'est à l'aide des moteurs de recherche que vous trouvez toutes les informations dont vous avez besoin. Il existe de nombreux moteurs de recherche.

1. Qu'est-ce qu'un moteur de recherche Internet

2. Moteurs de recherche populaires dans notre pays

3. Moteurs de recherche populaires à l’étranger

4. Moteurs de recherche inhabituels

5. Comment rechercher correctement des informations sur Internet

Le plus meilleur psystèmes de recherche dans notre pays:

http://www.yandex.ru

http://www.google.com

http://www.aport.ru

http://www.rambler.ru/

http://go.mail.ru

http://www.webalta.ru/

Le moteur de recherche le plus mal-aimé et le plus intrusif de tous.

Moteurs de recherche populaires à l’étranger

http://www.altavista.com

http://www.alltheweb.com

http://www. bing.com

http://www.google.com
http://www.excite.com
http://www.lycos.com
http://www.mamma.com

http://www.yahoo.com

http://www.dmoz.com
http://www.hotbot.com
http://www.dogpile.com
http://www.netscape.com
http://www.msn.com
http://www.webcrawler.com
http://www.jayde.com
http://www.aol.com
http://www.euroseek.com
http://www.teoma.com
http://www.about.com
http://www.ixquick.com
http://www.lookle.com
http://www.metaeureka.com
http://www.searchspot.com
http://www.slider.com
http://www.allthesites.com
http://www.clickey.com
http://www.galaxy.com
http://brainysearch.com
http://www.orura.com

Chaque pays possède ses propres moteurs de recherche populaires.

Des moteurs de recherche inhabituels

  • CanardCanardAller (https://duckduckgo.com/) - un moteur de recherche hybride avec une politique de confidentialité pour l'utilisateur et ses requêtes de recherche.

  • Oeil d'étain (http://tineye.com/) est un moteur de recherche spécialisé dans la recherche d'images sur Internet. Il a récemment perdu de sa pertinence après que Google ait introduit la même fonction dans sa recherche d'images.

  • Guenon (http://www.genon.ru/) est un moteur de recherche qui collecte et crée du contenu sur son site Web.

Dans presque tous les moteurs de recherche, en plus du champ de recherche, il existe liens aux sites d'information les plus populaires et aux sites sur certains sujets.

Comment rechercher correctement des informations sur Internet

Chaque moteur de recherche possède ses propres algorithmes (règles) pour rechercher des informations.

Afin de trouver des informations sur Internet via un moteur de recherche, vous devez saisir dans le champ de recherche demande. Si vous saisissez un mot, alors cette requête vous donnera des milliers de liens vers des sites où ce mot est mentionné.

Par conséquent, il est nécessaire de saisir une requête aussi précise que possible, composée de deux, trois phrases ou plus.

Regardons un exemple de requête sur un moteur de recherche Yandex.

Disons que vous souhaitez trouver des informations sur l'achat d'un ordinateur. Si vous écrivez un mot dans le champ de recherche « Ordinateur", alors vous obtiendrez 133 millions de réponses

Vous devez poser une demande plus précise. Il est préférable d'indiquer quel ordinateur vous souhaitez acheter et où (dans quelle ville).

Le moteur de recherche vous donnera alors beaucoup moins de réponses à votre requête.

Le moteur de recherche ne se soucie pas du tout de savoir si vous saisissez votre requête en majuscules ou en minuscules.

Yandex fait la distinction entre les noms et les adjectifs, mais ignore complètement les terminaisons.

Il est également complètement indifférent aux cas, aux pluriels, etc.

Pour rendre la recherche plus précise, vous devez mettre la requête entre guillemets ou mettre un point d'exclamation devant le mot.

Regardez maintenant la même requête, mais sans les points d'exclamation.

Voyez-vous la différence? Avec des points d'exclamation, le nombre de réponses n'est pas de 2 millions, mais de 186 mille.

Si vous placez un point d'exclamation devant un mot avec une majuscule, vous recevrez des réponses dans lesquelles ce mot particulier avec une majuscule apparaît.

Si le mot est au nominatif et que vous avez besoin d'informations sur exactement un tel mot, et exactement tel que vous l'avez écrit, alors mettez deux devant ce mot point d'exclamation. Par exemple: !!Balle .

La recherche vous donnera des réponses pour exactement ce mot " Balle" comme tu l'as écrit. Pas " balle", Pas " des balles", et avec une majuscule.

Si vous écrivez une phrase avec le mot " sur", alors Yandex ignorera " sur" Par exemple: " sur l'étagère" La recherche s'effectuera uniquement à l'aide du mot " étagère ».

Pour qu’il en tienne compte et ne l’ignore pas, il faut devant le mot « sur» mettez un signe plus – « +sur ».

Chaque moteur de recherche possède son propre algorithme de recherche, donc si vous en utilisez certain moteur de recherche, et que vous souhaitez apprendre à composer correctement des requêtes, il vous suffit alors de taper « règles de recherche dansGoogle " ou " règles de recherche dans Yandex ", suivez le lien vers la réponse à votre demande et lisez les informations nécessaires.

Un moteur de recherche est une base de données d'informations spécifiques sur Internet. De nombreux utilisateurs pensent que dès qu'ils saisissent une requête dans un moteur de recherche, l'ensemble d'Internet est immédiatement exploré, mais ce n'est pas du tout vrai. Internet est analysé en permanence par de nombreux programmes, les données sur les sites sont saisies dans une base de données, où certain critère tous les sites et toutes leurs pages sont répartis dans différents types de listes et de bases de données. C'est-à-dire qu'il s'agit d'une sorte de classeur de données, et la recherche n'a pas lieu sur Internet, mais sur ce classeur.

Google est le moteur de recherche le plus populaire au monde.

En plus du moteur de recherche, Google propose de nombreux services, programmes et matériel, dont un service de messagerie, le navigateur Google Chrome, la plus grande bibliothèque de vidéos YouTube et bien d'autres projets. Google achète en toute confiance de nombreux projets qui génèrent d'importants bénéfices. La plupart des services ne sont pas destinés à l'utilisateur direct, mais à gagner de l'argent sur Internet et sont intégrés en mettant l'accent sur les intérêts des utilisateurs européens et américains.

Mail est un moteur de recherche populaire principalement en raison de son service de messagerie.

Il existe de nombreux services supplémentaires, dont la clé est Mail, la société Mail possède actuellement le réseau social Odnoklassniki, son propre réseau « My World », le service Money-mail, de nombreux jeux en ligne, trois navigateurs presque identiques avec des noms différents. Toutes les applications et services contiennent de nombreux contenus publicitaires. Le réseau social VKonatkte bloque les transitions directes vers Services de messagerie, aggravant gros montant virus.

Wikipédia.

Wikipédia est un système de référence de recherche.

Le moteur de recherche à but non lucratif, qui fonctionne grâce à des dons privés, ne remplit donc pas ses pages de publicité. Un projet multilingue dont le but est de créer une encyclopédie complète de référence dans toutes les langues du monde. Il n'a pas d'auteurs spécifiques et est alimenté et géré par des bénévoles du monde entier. Chaque utilisateur peut à la fois rédiger et modifier un article.

Page Officielle- www.wikipedia.org.

Youtube est la plus grande bibliothèque de fichiers vidéo.

Hébergement vidéo avec des éléments d'un réseau social, où chaque utilisateur peut ajouter une vidéo. Dès l'achat par Google Ink, une inscription séparée pour YouTube n'est pas requise, il suffit de vous inscrire dans le service de messagerie Google.

Page officielle - youtube.com.

Yahoo! est le deuxième moteur de recherche le plus important au monde.

Disponible des services supplémentaires, dont le plus célèbre est Yahoo Mail. Dans le cadre de l'amélioration de la qualité du moteur de recherche, Yahoo transfère les données sur les utilisateurs et leurs requêtes à Microsoft. À partir de ces données, une idée des intérêts des utilisateurs se forme et un marché du contenu publicitaire se forme. Le moteur de recherche Yahoo, comme , est engagé dans l'acquisition d'autres sociétés, par exemple, Yahoo possède le service de recherche et le site Web Altavista. commerce électronique Alibaba.

Page officielle - www.yahoo.com.

WDL est une bibliothèque numérique.

La bibliothèque collectionne des livres qui apportent une valeur culturelle sous forme numérique. L'objectif principal est d'augmenter le niveau de contenu culturel d'Internet. L'accès à la bibliothèque est gratuit.

Page officielle - www.wdl.org/ru/.

Bing est un moteur de recherche de Microsoft.

Page officielle - www.baidu.com.

Moteurs de recherche en Russie

Rambler est un moteur de recherche « pro-américain ».

Initialement, il a été créé comme un portail multimédia Internet. Comme beaucoup d'autres moteurs de recherche, il propose des services de recherche d'images, de fichiers vidéo, de cartes, de prévisions météorologiques, une section d'actualités et bien plus encore. Les éditeurs proposent également un navigateur gratuit, Rambler-Nichrome.

Page officielle - www.rambler.ru.

Nigma est un moteur de recherche intelligent.

Un moteur de recherche plus pratique grâce à la présence de nombreux filtres et paramètres. L'interface vous permet d'inclure ou d'exclure les valeurs similaires suggérées dans la recherche pour obtenir de meilleurs résultats. De plus, lorsque vous recevez un résultat de recherche, cela vous permet d'utiliser des informations provenant d'autres moteurs de recherche majeurs.

Page officielle - www.nigma.ru.

Aport - catalogue de produits en ligne.

Dans le passé, c'était un moteur de recherche, mais après l'arrêt du développement et de l'innovation, il a rapidement perdu du terrain et . Actuellement, Aport est Plateforme d'échanges, où sont présentés les produits de plus de 1 500 entreprises.

Page officielle - www.aport.ru.

Spoutnik est un moteur de recherche national et un portail Internet.

Créé par Rostelecom. Actuellement en phase de test.

Page officielle - www.sputnik.ru.

Metabot est un moteur de recherche en pleine croissance.

Les tâches de Metabot consistent à créer un moteur de recherche pour tous les autres moteurs de recherche, en créant des positions de résultats en tenant compte des données de la liste complète des moteurs de recherche. Autrement dit, c'est un moteur de recherche pour les moteurs de recherche.

Page officielle - www.metabot.ru.

Le moteur de recherche a été suspendu.

Page officielle - www.turtle.ru.

KM est un multiportail.

Initialement, le site était un multiportail avec l'introduction ultérieure d'un moteur de recherche. La recherche peut être effectuée à la fois au sein du site et sur tous les sites RuNet surveillés.

Page officielle - www.km.ru.

Gogo - ne fonctionne pas, redirige vers un moteur de recherche.

Page officielle - www.gogo.ru.

Le multiportail russe, peu populaire, demande à être amélioré. Le moteur de recherche comprend des actualités, de la télévision, des jeux et une carte.

Page officielle - www.zoneru.org.

Le moteur de recherche ne fonctionne pas, les développeurs suggèrent d'utiliser le moteur de recherche.

Bonjour, chers lecteurs du site blog. , alors ses quelques utilisateurs en avaient assez de leurs propres signets. Cependant, comme vous vous en souvenez, cela s'est produit selon une progression géométrique et, très vite, il est devenu plus difficile de s'y retrouver dans toute sa diversité.

Puis sont apparus des répertoires (Yahoo, Dmoz et autres), dans lesquels leurs auteurs ajoutaient et triaient divers sites en catégories. Cela a immédiatement facilité la vie des utilisateurs alors peu nombreux. réseau mondial. Beaucoup de ces catalogues sont encore vivants aujourd’hui.

Mais après un certain temps, la taille de leurs bases de données est devenue si grande que les développeurs ont d'abord pensé à créer une recherche à l'intérieur de celles-ci, puis à créer Système automatisé indexer tous les contenus Internet pour les rendre accessibles à tous.

Les principaux moteurs de recherche du segment russophone de l'Internet

Comme vous le comprenez, cette idée a été mise en œuvre avec un succès fulgurant, mais tout s'est toutefois bien passé uniquement pour une poignée d'entreprises sélectionnées qui ont réussi à ne pas disparaître sur Internet. Presque tous les moteurs de recherche apparus lors de la première vague ont désormais disparu, sont devenus obsolètes ou ont été rachetés par des concurrents plus performants.

Un moteur de recherche est un mécanisme très complexe et, surtout, très gourmand en ressources (il s'agit non seulement de ressources matérielles, mais aussi humaines). Derrière l'apparemment simple , ou son analogue ascétique de Google, se cachent des milliers d'employés, des centaines de milliers de serveurs et plusieurs milliards d'investissements qui sont nécessaires pour que ce colosse puisse continuer à fonctionner et rester compétitif.

Entrer sur ce marché maintenant et repartir de zéro est plus une utopie qu'un une vraie affaire projet. Par exemple, l'une des sociétés les plus riches au monde, Microsoft, tente de prendre pied sur le marché de la recherche depuis des décennies, et ce n'est que maintenant que son moteur de recherche Bing commence lentement à répondre à ses attentes. Et avant cela, il y a eu toute une série d’échecs et de revers.

Que dire de l’entrée sur ce marché sans influence financière particulière. Par exemple, notre moteur de recherche national Nigma a dans son arsenal de nombreux éléments utiles et innovants, mais leur trafic est des milliers de fois inférieur à celui des leaders du marché russe. Par exemple, jetez un œil à l'audience quotidienne de Yandex :

À cet égard, nous pouvons supposer que la liste des principaux moteurs de recherche (les meilleurs et les plus chanceux) de Runet et de l'ensemble d'Internet a déjà été constituée et que toute l'intrigue réside uniquement dans qui finira par dévorer qui, ou comment leur part en pourcentage sera être distribués s’ils survivent tous et restent à flot.

Marché russe des moteurs de recherche est très clairement visible et ici, probablement, nous pouvons distinguer deux ou trois acteurs principaux et quelques acteurs mineurs. En général, une situation plutôt unique s'est développée sur RuNet, qui, si je comprends bien, ne s'est répétée que dans deux autres pays du monde.

Je parle du fait que le moteur de recherche Google, arrivé en Russie en 2004, n'a toujours pas réussi à prendre le leadership. En fait, ils ont essayé d'acheter Yandex à cette époque, mais quelque chose n'a pas fonctionné là-bas et maintenant « notre Russie », avec la République tchèque et la Chine, sont ces endroits où le tout-puissant Google, s'il n'est pas vaincu, alors, en en tout cas, se heurta à une sérieuse résistance.

En fait, pour voir l'état actuel des choses parmi les meilleurs moteurs de recherche sur RuNet N’importe qui peut le faire. Il suffira de coller cette URL dans la barre d'adresse de votre navigateur :

Http://www.liveinternet.ru/stat/ru/searches.html?period=month;total=yes

Le fait est que la plupart d’entre eux utilisent .

Après avoir entré l'URL donnée, vous verrez une image qui n'est pas très attrayante et présentable, mais qui reflète bien l'essence du problème. Faites attention aux cinq principaux moteurs de recherche à partir desquels les sites en russe reçoivent du trafic :

Oui, bien sûr, toutes les ressources proposant un contenu en russe ne se trouvent pas dans cette zone. Il y a aussi SU et RF, et des espaces communs Type COM or NET regorge de projets Internet axés sur Runet, mais l'échantillon est néanmoins assez représentatif.

Cette dépendance peut être présentée de manière plus colorée, comme par exemple quelqu'un l'a fait en ligne pour sa présentation :

Cela ne change rien à l'essence. Il y a quelques leaders et plusieurs moteurs de recherche très, très loin derrière. D’ailleurs, j’ai déjà écrit sur plusieurs d’entre eux. Parfois, il peut être très intéressant de se plonger dans l'histoire des succès ou, à l'inverse, d'approfondir les raisons des échecs de moteurs de recherche autrefois prometteurs.

Ainsi, par ordre d'importance pour la Russie et le Runet dans son ensemble, je vais les énumérer et leur donner de brèves caractéristiques :

    La recherche sur Google est déjà devenue un mot familier pour de nombreuses personnes sur la planète - vous pouvez en savoir plus sur le lien. Dans ce moteur de recherche, j'ai aimé l'option « traduction des résultats », lorsque vous receviez des réponses du monde entier, mais dans votre langue maternelle, mais maintenant, malheureusement, elle n'est pas disponible (du moins sur google.ru).

    Aussi dans Dernièrement Je suis également intrigué par la qualité de leur sortie (page de résultats du moteur de recherche). Personnellement, j'utilise toujours d'abord le moteur de recherche miroir RuNet (il y en a un là-bas, eh bien, j'y suis habitué) et seulement si je n'y trouve pas de réponse intelligible, je me tourne vers Google.

    Habituellement, leur sortie me rendait heureux, mais dernièrement, cela m'a seulement intrigué - parfois de telles absurdités ressortent. Il est possible que leur lutte pour augmenter leurs revenus avec publicité contextuelle et un remaniement constant des problèmes afin de discréditer Promotion du référencement peut conduire au résultat inverse. Quoi qu'il en soit, ce moteur de recherche a un concurrent sur RuNet, et quel genre de concurrent.

    Je pense qu'il est peu probable que quiconque aille spécifiquement sur Go.mail.ru pour effectuer une recherche dans RuNet. Par conséquent, le trafic vers des projets de divertissement provenant de ce moteur de recherche peut dépasser largement dix pour cent. Les propriétaires de tels projets doivent prêter attention à ce système.

Cependant, outre les leaders incontestés sur le marché des moteurs de recherche du segment russophone de l'Internet, il existe plusieurs autres acteurs dont la part est assez faible, mais le fait même de leur existence oblige néanmoins à dire quelques mots. à propos d'eux.

Moteurs de recherche Runet du deuxième échelon


Moteurs de recherche sur Internet

Dans l'ensemble, à l'échelle de l'ensemble de l'Internet, il n'y a qu'un seul acteur sérieux - Google. C'est le leader incontesté, mais il lui reste encore une certaine concurrence.

Tout d'abord, c'est toujours pareil Bing, qui, par exemple, occupe une très bonne position sur le marché américain, d'autant plus que son moteur est également utilisé sur tous les services Yahoo (près d'un tiers de l'ensemble du marché de recherche américain).

Eh bien, deuxièmement, en raison de la part énorme que représentent les utilisateurs chinois dans le nombre total d'utilisateurs Internet, leur principal moteur de recherche appelé Baidu se cale dans la répartition des places sur l’Olympe mondial. Il est né en 2000 et sa part représente désormais environ 80 % de l'ensemble du public national en Chine.

Il est difficile de dire quelque chose de plus intelligible sur Baidu, mais sur Internet, il existe des jugements selon lesquels les places dans son Top sont occupées non seulement par le plus pertinent à la demande sites, mais aussi ceux qui ont payé (directement au moteur de recherche, pas au bureau de référencement). Bien entendu, cela s’applique principalement aux annonces commerciales.

En général, en regardant les statistiques, il devient clair pourquoi Google accepte facilement de détériorer ses résultats de recherche en échange d'augmentation des bénéfices de la publicité contextuelle. En fait, ils n’ont pas peur du désabonnement des utilisateurs, car dans la plupart des cas, ils n’ont nulle part où aller. Cette situation est un peu triste, mais nous verrons ce qui se passera ensuite.

D'ailleurs, afin de rendre la vie encore plus difficile aux optimiseurs, et peut-être de préserver la tranquillité d'esprit des utilisateurs de ce moteur de recherche, Google récemment applique le cryptage lors de la transmission des requêtes du navigateur des utilisateurs à la chaîne de recherche. Bientôt, il ne sera plus possible de voir dans les statistiques des compteurs de visiteurs pour quelles requêtes les utilisateurs de Google s'adressent à vous.

Bien entendu, outre les moteurs de recherche mentionnés dans cette publication, il en existe des milliers d'autres - régionaux, spécialisés, exotiques, etc. Essayer de les énumérer et de les décrire tous dans un seul article serait impossible, et probablement pas nécessaire. Mieux vaut dire quelques mots sur comme il est facile de créer un moteur de recherche et combien il est facile et peu coûteux de le maintenir à jour.

La grande majorité des systèmes fonctionnent sur des principes similaires (lisez ceci et cela) et poursuivent le même objectif : donner aux utilisateurs une réponse à leur question. De plus, cette réponse doit être pertinente (correspondant à la question), complète et, ce qui n'est pas sans importance, pertinente (de première fraîcheur).

Résoudre ce problème n'est pas si facile, d'autant plus que le moteur de recherche devra analyser le contenu de milliards de pages Internet à la volée, éliminer celles qui sont inutiles et, à partir des autres, former une liste (problème), où le plus les réponses appropriées à la question de l'utilisateur apparaîtront en premier.

Cette tâche extrêmement complexe est résolue par la collecte préliminaire d'informations à partir de ces pages à l'aide de divers robots d'indexation. Ils collectent des liens à partir de pages déjà visitées et chargent leurs informations dans la base de données du moteur de recherche. Il existe des robots qui indexent du texte (un robot régulier et rapide qui vit de l'actualité et des ressources fréquemment mises à jour afin que les dernières données soient toujours présentées dans les résultats).

De plus, il existe des robots qui indexent les images (pour leur sortie ultérieure), des favicons, des miroirs de sites (pour leur comparaison ultérieure et leur éventuel collage), des robots qui vérifient la fonctionnalité des pages Internet, quelles utilisateurs ou via des outils pour les webmasters (ici vous peut lire, et) .

Le processus d'indexation lui-même et le processus ultérieur de mise à jour des bases de données d'indexation prennent beaucoup de temps. Bien que Google le fasse beaucoup plus rapidement que ses concurrents, du moins Yandex, ce qui prend une semaine ou deux pour le faire (lire à propos).

Généralement, un moteur de recherche divise le contenu textuel d'une page Internet en mots individuels, qui sont réduits aux principes de base, afin de pouvoir ensuite donner des réponses correctes aux questions posées sous différentes formes morphologiques. Tous les excédents de kit carrosserie sous la forme Balises HTML, espaces, etc. les choses sont supprimées, et les mots restants sont triés par ordre alphabétique et leur position dans ce document est indiquée à côté d'eux.

Ce genre de chose s'appelle un index inversé et vous permet de rechercher non pas par pages Web, mais par données structurées situées sur les serveurs des moteurs de recherche.

Le nombre de ces serveurs pour Yandex (qui recherche principalement uniquement des sites en russe et un peu en ukrainien et en turc) se compte en dizaines, voire en centaines de milliers, et pour Google (qui recherche dans des centaines de langues) - en millions. .

De nombreux serveurs disposent de copies, qui servent à la fois à accroître la sécurité des documents et à contribuer à augmenter la vitesse de traitement des demandes (en répartissant la charge). Estimez les coûts liés au maintien de l’ensemble de cette économie.

La demande de l'utilisateur sera envoyée par l'équilibreur de charge au segment de serveur actuellement le moins chargé. Ensuite, une analyse est effectuée de la région à partir de laquelle l'utilisateur du moteur de recherche a envoyé sa demande, et elle est analysée morphologiquement. Si une requête similaire a été récemment saisie dans la barre de recherche, l'utilisateur reçoit les données du cache afin de ne pas surcharger à nouveau les serveurs.

Si la requête n'a pas encore été mise en cache, elle est alors transférée vers la zone où se trouve la base de données d'index du moteur de recherche. En réponse, vous recevrez une liste de toutes les pages Internet qui sont au moins quelque peu liées à la demande. Non seulement les occurrences directes sont prises en compte, mais aussi d'autres formes morphologiques, etc. des choses.

Leur il faut classer et à ce stade l'algorithme entre en jeu ( intelligence artificielle). En effet, la demande de l'utilisateur se multiplie aux dépens de tout le monde options possibles son interprétation et les réponses à de nombreuses requêtes sont recherchées simultanément (grâce à l'utilisation d'opérateurs de langage de requête, dont certains sont accessibles aux utilisateurs ordinaires).

En règle générale, les résultats de recherche contiennent une page de chaque site (parfois plus). sont désormais très complexes et prennent en compte de nombreux facteurs. De plus, pour les corriger, on utilise des sites d'évaluation manuels, ce qui permet d'ajuster le fonctionnement de l'algorithme dans son ensemble.

En général, force est de constater que l’affaire est obscure. Nous pouvons en parler pendant longtemps, mais il est déjà clair que la satisfaction des utilisateurs avec un système de recherche est obtenue, oh, comme c'est difficile. Et il y aura toujours ceux qui n’aimeront pas quelque chose, comme vous et moi, chers lecteurs.

Bonne chance à toi! A bientôt sur les pages du site blog

Vous pouvez regarder plus de vidéos en allant sur
");">

Vous pourriez être intéressé

Yandex People - comment rechercher des personnes par réseaux sociaux Apomètre - service gratuit pour suivre les changements dans les résultats de recherche et les mises à jour des moteurs de recherche DuckDuckGo – un moteur de recherche qui ne vous suit pas
Comment vérifier la vitesse d'Internet - test en ligne connexions sur ordinateur et téléphone, SpeedTest, Yandex et autres compteurs
Images Yandex et Google, ainsi que recherche par fichier image dans Tineye (tinai) et Google