Место хранения информации в сети. Хранение данных в сети Internet. Дух коммерции или на чем зарабатывают дата-центры

Именно информация приводит в действие весь современный бизнес и в настоящий момент считается наиболее ценным стратегическим активом любого предприятия. Объем информации растет в геометрической прогрессии вместе с ростом глобальных сетей и развитием электронной коммерции. Для достижения успеха в информационной войне необходимо обладать эффективной стратегией хранения, защиты, совместного доступа и управления самым важным цифровым имуществом - данными - как сегодня, так и в ближайшем будущем.

правление ресурсами хранения данных стало одной из самых животрепещущих стратегических проблем, стоящих перед сотрудниками отделов информационных технологий. Вследствие развития Интернета и коренных изменений в процессах бизнеса информация накапливается с невиданной скоростью. Согласно данным компании Strategic Research, сегодня только на серверах открытых систем хранится не менее 200 петабайт информации, и этот объем удваивается каждые полтора года. Многие компании включились в своеобразное соревнование по преобразованию внутренних систем ведения бизнеса, чтобы использовать Интернет для его развития. Они глобализируют свои системы IT для более полной поддержки приложений электронной коммерции, непрерывно работающих 24 часа в сутки, 7 дней в неделю, 365 дней в году.

Сетевое хранение данных позволяет решить многие текущие задачи в бизнесе, связанные с хранением информации, а именно:

  • универсальный и совместный доступ к ресурсам;
  • поддержание непредсказуемого, взрывного роста системы IT;
  • обеспечение непрерывной доступности при сохранении экономичности;
  • обеспечение маcштабируемости и высочайшей скорости работы хранилища данных;
  • создание необходимых условий для работы новых приложений, например приложений резервного копирования, без участия сервера и LAN;
  • упрощение управления ресурсами, связанного с их централизацией;
  • повышение уровня защиты информации и отказоустойчивости.

До сегодняшнего момента продукты сетевого хранения разделялись на устройства сетевого хранения (Network Attached Storage, NAS) и сети хранения данных (Storage Area Network, SAN). Продукты NAS уходят корнями в сеть Ethernet и спроектированы в соответствии с концепцией файл-сервера. Продукты SAN продолжают технологию хранения SCSI и включают несколько видов, разработанных для обеспечения функций ввода-вывода; в их число входят системные контроллеры ввода-вывода и устройства и подсистемы хранения. Наиболее известными продуктами SAN являются те, которые заменили параллельную шину SCSI коммутаторами и концентраторами.

Продукты SAN вышли на рынок на несколько лет позднее продуктов NAS. Когда на рынке появились обе технологии, специалисты ставили вопрос по поводу их будущего. В результате такой ситуации возник ряд интересных решений, в том числе предпринимались попытки разделить их на две разные архитектуры. Хотя SAN и NAS различны по структуре, они во многом одинаковы и в них заложен потенциал для разного рода интеграций.

Технологии хранения данных

етевое хранение данных построено на трех фундаментальных компонентах: коммутации, хранении и файлах. Все продукты хранения можно представить в виде комбинации функций данных компонентов. Поначалу это может вызвать замешательство: поскольку продукты хранения разрабатывались по совершенно разным направлениям, функции часто перекрывают друг друга.

Немало специалистов провели много часов за работой, пытаясь определить, как написать лучшую прикладную программу для привлечения заказчиков в сетевые хранилища и как сделать более понятной технологию хранения на основе своего успешного приложения. Конечно, для этого существует много способов, но в данной статье мы исходим из того, что хранение само по себе является приложением. В сети работает множество приложений типа «клиент-сервер» и различных видов распределенных приложений, но в то же время хранение является уникальным и специализированным типом приложения, которое может функционировать в нескольких сетевых средах.

Поскольку процессы хранения тесно интегрированы с сетями, будет уместно напомнить, что сетевые хранилища представляют собой системные приложения. Сервисами, которые предоставляются сетевыми приложениями хранения, могут пользоваться сложные корпоративные программы и пользовательские приложения. Как и в случае со многими технологиями, некоторые типы систем лучше отвечают требованиям сложных приложений высокого уровня.

Коммутация

Термин «коммутация» применяется ко всему программному и аппаратному обеспечению и к службам, которые обеспечивают транспортировку хранения и управление ею в сетевом хранилище. Сюда входят такие различные элементы, как разводка кабелей, сетевые контроллеры ввода-вывода, коммутаторы, концентраторы, аппаратура выборки адресов, контроль связи данных, транспортные протоколы, безопасность и резервы ресурсов. В сетевых хранилищах все еще широко используются технологии шин данных SCSI и ATA, и, скорее всего, они будут использоваться еще долго. Фактически продукты SCSI и ATA сегодня применяются гораздо чаще в технологии NAS.

Существуют два важных различия между сетями хранения SAN и обычными локальными сетями LAN. Сети хранения SAN автоматически синхронизируют данные между отдельными системами и хранилищами. В сетевых хранилищах необходимы компоненты высокой степени точности для обеспечения надежной и предсказуемой среды. Несмотря на ограничения по расстоянию, параллельная SCSI - чрезвычайно надежная и предсказуемая технология. Если новые технологии коммутации, такие как Fibre Channel, Ethernet и InfiniBand, сменят SCSI, они должны будут продемонстрировать аналогичный или лучший уровень надежности и предсказуемости. Имеется и такая точка зрения, которая рассматривает коммутацию как канал хранилища. Сам термин «канал», берущий свое начало в среде больших вычислительных машин, предполагает высокую надежность и работоспособность.

Хранение

Хранение в основном затрагивает блочные операции адресного пространства, включая создание виртуальной среды, когда адреса логического блока хранения отображаются из одного адресного пространства в другое. Вообще говоря, в сетевых хранилищах функция хранения почти не изменилась, если не считать двух заметных отличий.

Первое - это возможность нахождения технологий виртуализации устройства, например управление устройством внутри оборудования сетевого хранения. Этот вид функции иногда называют контроллером домена хранения или виртуализацией LUN.

Второе главное отличие хранения заключается в масштабируемости. Продукты хранения, такие как подсистемы хранения, имеют значительно больше контроллеров/интерфейсов, чем предыдущие поколения шинной технологии, а также намного больший объем хранения.

Файлы

Функция организации файлов представляет абстрактный объект конечному пользователю и приложениям, а также организует разметку данных на реальных или виртуальных устройствах хранения. Основную часть функциональности файлов в сетевых хранилищах обеспечивают файловые системы и базы данных; их дополняют приложения управления хранением, например операции резервного копирования, также являющиеся файловыми приложениями.

Сетевое хранение к настоящему времени почти не изменило файловые функции, за исключением разработки файловых систем NAS, в частности файловой системы WAFL компании Network Appliance.

Кроме упомянутых технологий хранения данных NAS и SAN, ориентированных на крупные и глобальные сети, в небольших локальных сетях доминирующее положение занимает технология DAS (Direct Attached Storage - рис. 1), в соответствии с которой хранилище находится внутри сервера, обеспечивающего объем хранилища и необходимую вычислительную мощность.

Простейшим примером DAS может служить накопитель на жестком диске внутри персонального компьютера или ленточный накопитель, подключенный к единственному серверу. Запросы ввода-вывода (называемые также командами или протоколами передачи данных) непосредственно обращаются к этим устройствам. Однако такие системы плохо масштабируются, и компании с целью расширения объема хранилища вынуждены приобретать дополнительные серверы. Эта архитектура очень дорогая и может использоваться только для создания небольших по объему хранилищ данных.

Storage Area Network

истема хранения данных SAN (рис. 2) реализуется в специализированной локальной сети. Как и в DAS, запросы ввода-вывода непосредственно обращаются к устройствам хранения. В большинстве современных сетей SAN использует высокопроизводительный канал Fibre Channel, который обеспечивает произвольное соединение процессоров и устройств хранения данных в этой сети.

Системы хранения данных SAN позволяют решать следующие задачи: программная коммутация, создание удаленных хранилищ, консолидация хранилищ, создание гетерогенных хранилищ и обеспечение резервного копирования.

Программная коммутация. Необходимость решения этой задачи возникла исходя из ситуаций, когда в информационной системе имеется достаточно большой набор дисковых систем и требуется время от времени подключать наборы дисков к различным серверам. В случае обычных SCSI-дисков это требует физической перекоммутации, часто необходима остановка системы. Однако применение протокола Fibre Channel, FC-концентраторов и FC-коммутаторов позволяет использовать программный способ. Важно отметить, что при этом каждый диск остается подключенным только к одному серверу. Сегодня эти решения успешно применяются, а дальнейшее их развитие будет вести к поддержке большего числа хостов и к увеличению гибкости при коммутации.

Удаленные хранилища. Совершенствование технологии привело к тому, что стало возможным относить дисковые массивы на расстояния до 10 км от сервера, тем самым обеспечивая защиту данных от катастроф.

Консолидация хранилищ. Прежде всего консолидация хранилищ обеспечивает значительную экономию при эксплуатации и большую надежность систем.

Гетерогенные хранилища. Консолидация хранилищ приводит к гетерогенным подключениям к дисковому массиву, так как в информационной системе всегда существуют различные программно-аппаратные платформы.

Прямое резервное копирование. Идея прямого резервного копирования заключается в обеспечении прямого копирования данных с диска на ленточный накопитель, минуя локальную сеть. Таким образом, процессорная мощность серверов будет загружена по минимуму.

Network Attached Storage

Устройство хранения данных NAS (рис. 3) с сетевым интерфейсом (appliance) обычно содержит серверный процессор и систему дисковой памяти и подключается к сети, построенной на основе протокола TCP/IP (LAN или WAN). Доступ к устройствам NAS производится с помощью специальных протоколов доступа к файлам и совместного доступа к файлам. Принимаемые устройством NAS файловые запросы транслируются внутренним процессором на уровень запросов ввода-вывода устройства хранения данных. Наиболее распространенными протоколами файлового доступа являются протоколы CIFS (Common Internet File System - общая файловая система Интернета), которые используются на платформах Windows и NFS (Network File System - сетевая файловая система, применяемая на платформах UNIX). Эти протоколы работают поверх IP-протокола, используемого в Ethernet-сетях и в Интернете. Их назначение - обмен файлами между компьютерами, благодаря чему клиенты Windows, Macintosh и UNIX имеют полноценный доступ к дисковому массиву.

Одна из привлекательных ключевых особенностей NAS состоит в облегчении администрирования сетевого решения в целом за счет инсталляции в NAS своей «тонкой» операционной системы.

Технологии коммутации

Fibre Channel

Основное достоинство технологии Fibre Channel заключается в том, что это высокоскоростная, низколатентная сеть с современной технологией контроля потоков - обработки такого пульсирующего трафика, как ввод-вывод хранения. Следует отметить, что именно эта характеристика отличается слабостью у Ethernet. Индустрия Fibre Channel несравнима с Ethernet, и поэтому у нее небольшой выбор технологий и относительно небогатый опыт внедрения и управления.

Технология Fibre Channel стала первой легальной разработкой общей коммутации. Однако, как было не раз доказано, одна технология ничего не решает. Индустрия Fibre Channel не заинтересовалась предоставляемым потенциалом. Эта технология начиналась как стандарт де-факто для SAN, но маловероятно, что Fibre Channel будет использоваться в NAS и выйдет на рынок «клиент-сервер».

Ethernet

Ethernet - самая распространенная сетевая технология в мире; существует огромное количество специалистов и множество методов для внедрения и управления сетями Ethernet. Хотя 10/100-мегабитные разновидности Ethernet достаточны для NAS, они не подходят для поддержки SAN вследствие ограничений полосы пропускания и отсутствия управления потоками. Поэтому основанием для построения SAN станет, видимо, Gigabit Ethernet.

Без сомнения, Ethernet будет использоваться в качестве общей функции коммутации как для файлов, так и для приложений хранения, но прежде чем он начнет широко применяться в качестве корпоративной индустриальной сети, следует доказать его релевантность по отношению к хранению.

InfiniBand

InfiniBand - последовательная шина данных - служит заменой системной шине ввода-вывода PCI. Разработку InfiniBand возглавляла корпорация Intel в сотрудничестве с Compaq, Hewlett-Packard, IBM, Sun и др. В качестве основного компонента системы, который, как ожидается, будет использоваться на платформах и PC, и UNIX, InfiniBand, вероятно, будет применяться в значительных масштабах.

В отношении сетевых хранилищ возникают следующие вопросы. Будут ли файловые приложения и приложения хранения функционировать непосредственно на шине InfiniBand или потребуют каких-либо сетевых адаптеров InfiniBand? И когда это произойдет - сразу, скоро, через несколько лет или вообще никогда? Видимо, данная технология должна зарекомендовать себя в качестве общей системной шины ввода-вывода, прежде чем она сможет эффективно завоевывать такие новые рынки, как рынок сетевых хранилищ. Однако у InfiniBand есть очевидный потенциал, чтобы в будущем стать основной функцией коммутации.

Корпоративное хранение - это прекрасная, но весьма проблематичная идея. Каким образом самоуправляемая подсистема хранения может стать достаточно разумной, чтобы обеспечить управляющие и контролирующие сервисы данных, которые в ней хранятся? Поддержка подсистемами хранения функций уровня хранения позволяет им выступать в качестве «сверхвиртуальных» устройств, но это не придает им способности оперировать объектами-данными (например, файлами), как хотелось бы менеджерам информационных технологий.

Такое решение намного сложнее, чем простое расположение микропроцессоров в подсистемах хранения. Самоуправляющиеся подсистемы хранения должны обладать способностью определять, какие именно блоки соответствуют конкретным объектам данных (то есть файлам, таблицам баз данных и метаданным), если они собираются управлять ими. Похоже, что «недостающее звено» представляет собой некоторое количество встроенной файловой функциональности, которое должно обеспечить возможность ассоциирования объектов данных с их местом хранения. Это целиком и полностью находится в сфере ответственности уровня структуры данных стека ввода-вывода. Такой уровень можно представить как «нижний слой» файловой системы, который контролирует помещение объектов данных в реальное или виртуальное хранилище.

Архитектурная проблема NAS и SAN заключается в том, что подсистемы хранения со встроенной файловой технологией обычно считаются продуктами NAS. А как тогда назвать подсистему хранения с половиной файловой системы? Именно поэтому анализ сетевого хранения в терминах SAN или NAS ничего не дает. NAS и SAN являются независимыми объектами; независимыми являются также коммутация, хранение и файлы.

Технология NAS, во-первых, предоставляет сервис, позволяющий приложениям и пользователям находить данные в виде объектов в сети, во-вторых, поставляет системе данные для хранения в устройствах хранения или в подсистемах. А технология SAN предоставляет функции хранения в сети; в общем и целом, она применяется в отношении логических блоков адресов, но в потенциале может использовать и другие методы адресации и идентификации хранимых данных.

Коммутация для сетей хранения должна быть чрезвычайно быстрой и надежной. До сих пор в этой роли выступал Fibre Channel, но в будущем на рынок должны выйти Gigabit Ethernet и InfiniBand. Развитие общей инфраструктуры коммуникации как для файловых приложений (NAS), так и для приложений хранения (SAN) кажется неизбежным, в итоге она станет ключевой технологией.

В ближайшем времени технологии сетевого хранения данных, такие как SAN и NAS, будут использоваться повсеместно - просто потому, что количество информации на Земле удваивается каждый год.

КомпьютерПресс 2"2002

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

Государственное образовательное учреждение высшего профессионального образования

«ТАГАНРОГСКИЙ ГОСУДАРСТВЕННЫЙ ПЕДАГОГИЧЕСКИЙ ИНСТИТУТ имени А.П. Чехова »

Факультет информатики

Кафедра информатики и управления

Курсовая работа

Организация хранения и поиска информации в сети Internet

Студентки 4 курса

Шеверда М.А.

Информатика с доп. спец. Иностр.яз.

Научный руководитель

К.Т.Н. Доц. Тюшнякова И.А.

Таганрог

Введение

Основные понятия информационного поиска

Инфаструктура сети

История появления поисковых систем

1 История создания поисковой системы Google

2 Принцип работы поисковой системы Google

3 Поисковая система Yandex

4 Поисковая система Rambler

5 Поисковая система Yahoo

6 Поиск по адресам URL

Поиск информации в сети Internet

Сохранение информации в сети Internet

Заключение

Список литературы

Введение

Интернет - это глобальная компьютерная сеть, в которой размещены различные службы или сервисы (E-mail, Word Wide Web, FTP, Usenet, Telnet и т.д.). Компьютерные сети предназначены для передачи данных, а телефонные сети и радиосети - для передачи голоса, телевизионные сети - для передачи изображения.

В зависимости от расстояний между ПК различают локальные, территориальные и корпоративные вычислительные сети. Конвергенция телекоммуникационных сетей (компьютерных, радио, телефонных и телевизионных сетей) обеспечивает возможность качественной передачи данных, голоса и изображения по единым (мультисервисным) сетям нового поколения (сетям Internet).

Интернет давно уже стал не только средством общения, но и полем для серьезной коммерческой деятельности. Практически каждая зарубежная фирма имеет в Сети свое представительство, виртуальный офис. Суммарный оборот компаний, ведущих торговлю в Интернет, достигает миллиардов долларов. В России также все большее число компаний использует Интернет для продвижения своих товаров и услуг. В этом легко убедиться, просмотрев рекламные издания. Рядом с привычными номерами телефонов и факсов все чаще и чаще встречаются адреса электронной почты и Web-сайтов. Скоро отсутствие адреса в Интернет будет затруднять работу так же, как отсутствие факса.

Поэтому все больше и больше людей обращаются в Интернет, чтобы получить самую свежую информацию: об услугах и ценах, погоде, курсах валют, просто новости. На Web-сайте можно менять информацию несколько раз в день. В печатных изданиях надо заказывать рекламу минимум за неделю, а то и больше. А в Интернет все оперативно: новые товары или услуги, новая скидка или новый поставщик - завтра об этом узнают клиенты. Нет необходимости ждать, пока выйдет очередной выпуск печатной рекламы. Информация на сайте будет всегда актуальной, самой свежей. Именно это ценят, именно это привлекает в Интернет миллионы пользователей.

Важнейшим условием и ведущим фактором, определяющим успешность учебной деятельности с использованием компьютерных технологий, является готовность учащихся к продуктивной деятельности в дидактической компьютерной среде.

Большинство исследователей в области педагогической информатики отмечают существование противоречия между представлениями современной гуманитарно-личностной парадигмы образования и существующей системой обучения с узкопредметной ориентацией, не обеспечивающей готовность учащегося к учебной деятельности с использованием компьютерных методов получения и преобразования информации. Становится очевидным, что концепции использования в учебном процессе информационных технологий эволюционируют от технократических парадигм в направлении усиления роли социокультурных факторов, учета нравственного и интеллектуального потенциала личности.

Овладение эффективными методами и средствами поиска, обработки и использования учебной информации дает возможность не только интенсифицировать образовательные процессы, но и развивать познавательные интересы учащихся, стремление к продуктивной, творческой деятельности.

Цель курсовой работы:

Исследовать существующие системы и механизмы поиска информации в сети.

Задачи курсовой работы:

1. Изучить соответствующую данной теме специализированную литературу.

На основе полученных из данной литературы знаний, выяснить каким образом устроены процессы хранения и поиска информации в глобальной сети

Найти сходства и различия поисковых машин.

1.
Основные понятия информационного поиска

Информационно-поисковая система (ИПС) - это упорядоченная совокупность документов (массивов документов) и информационных технологий, предназначенных для хранения и поиска информации - текстов (документов) или данных (фактов). Информационно-поисковыми системами являются любые определенным образом организованные хранилища информации. Причем информационно-поисковые системы могут быть и неавтоматизированными. Главное - это целевая функция: хранение и поиск информации.

В зависимости от объекта хранения и типа запроса различают два вида информационного поиска: документальный и фактографический - и, соответственно, два типа ИПС - документальные и фактографические.

Документальными называются ИПС, в которых реализуется поиск по тематическим запросам в массиве документов или текстов с последующим предоставлением пользователю подмножества этих документов или их копий. Понятие документа может меняться от системы к системе. В общем случае это некий информационный объект, зафиксированный (обычно посредством некоторой знаковой системы) на каком-то материальном носителе (бумага, фото- и кинопленка и т.п.) и предназначенный для передачи в пространстве и времени в системе социальных коммуникаций.

Фактографические ИПС реализуют хранение, поиск и выдачу непосредственно фактических данных (научных, технических, экономических характеристик и свойств объектов, процессов, явлений, адресов, наименований, количественных данных и т.п.).

Главное, различие между документальным и фактографическим поиском заключается в подходе к семантике документов. В документальных системах описывается смысл документов в целом с точки зрения их тематического, предметного содержания. В этом случае важно выявить и назвать (перечислить) основные темы и объекты, которым посвящен документ. В фактографических системах описываются объекты, фиксируются их признаки и значения этих признаков. Отсюда различия в языках описания и способах хранения описаний в системе. Соответственно, для каждого вида поиска существуют свои поисковые средства.

Фактографические системы предполагают накопление и поиск в массиве документов со строго регламентированной структурой. Такая структура является или результатом предварительной интеллектуальной обработки документов при вводе информации в систему, или наличием таких документов в готовом виде в конкретных сферах человеческой деятельности, например, учетные формы, бланки, справочники, расписания и т.п. Существуют фактографические ИПС, которые обеспечивают накопление информации и поиск только по одному типу объектов и только по одному типу запросов. Существуют и более развитые фактографические системы, обеспечивающие хранение и поиск данных, разнообразных по содержанию и структуре, но это разнообразие всегда конечно.

В то же время между документальными и фактографическими системами нет непреодолимой разницы. Нередко реальные ИПС представляют собой пример смешанных систем, в которых фактографическая информация используется как дополнительное средство документального поиска, и наоборот. В документальных системах тексты (документы) также могут быть структурированы, разбиты на фрагменты или поля, и обработка и выдача документальной информации может вестись на уровне отдельных полей.

Выделяют еще и третий тип систем, которые называют информационно-логическими. Это системы, отвечающие на запросы, на которые в информационной базе в явном виде ответа нет. Получить ответ помогает экстралингвистическая база знаний и информация, порождаемая алгоритмически из уже имеющейся (документальной или фактографической). Эта новая информация или выдается как ответ на запрос, или дополнительно используется для поиска.

Информационно-поисковая система документального типа представляет собой упорядоченную совокупность документов, а также совокупность средств и методов, предназначенных для хранения, поиска и выдачи по запросам документальной информации. Документальная ИПС выдает документы, соответствующие запросу по теме, по предмету.

большинство работающих ИПС относится к классу вербальных систем бестезаурусного типа, когда индексационные термины выбираются непосредственно из текстов документов. Лавинообразный рост объемов электронной документальной информации, ее видовое, тематическое и языковое разнообразие являются как причиной кризиса современного информационного поиска, так и стимулом его совершенствования.

Проблема поиска ресурсов в сети Интернет была осознана достаточно скоро, и в ответ появились различные системы и программные инструменты для поиска, среди которых следует назвать системы Gopher, Archie, Veronica, WAIS, WHOIS и др. В последнее время на смену этим инструментам пришли «клиенты» и «серверы» всемирной паутины WWW.

Если попытаться дать классификацию ИПС сети Интернет, то можно выделить следующие основные типы:

ИПС вербального типа (поисковые системы - search engines)

Классификационные ИПС (каталоги - directories)

Электронные справочники («желтые» страницы и т.п.)

Специализированные ИПС по отдельным видам ресурсов

Интеллектуальные агенты.

Глобальный учет всех ресурсов Интернета обеспечивается вербальными и отчасти классификационными системами.

2. Инфраструктура сети (структура и принципы построения сети Интернет)

Всемирная информационная компьютерная сеть, представляющая собой объединение множества региональных компьютерных сетей и компьютеров, обменивающих друг с другом информацией по каналам общественных телекоммуникаций (выделенным телефонным аналоговым и цифровым линиям, оптическим каналам связи и радиоканалам, в том числе спутниковым линиям связи).

Информация в Internet хранится на серверах. Серверы имеют свои адреса и управляются специализированными программами. Они позволяют пересылать почту и файлы, производить поиск в базах данных и выполнять другие задачи.

Обмен информацией между серверами сети выполняется по высокоскоростным каналам связи (выделенным телефонным линиям, оптоволоконным и спутниковым каналам связи). Доступ отдельных пользователей к информационным ресурсам Internet обычно осуществляется через провайдера или корпоративную сеть.

Провайдер - поставщик сетевых услуг - лицо или организация предоставляющие услуги по подключению к компьютерным сетям. В качестве провайдера выступает некоторая организация, имеющая модемный пул для соединения с клиентами и выхода во всемирную сеть.

Основными ячейками глобальной сети являются локальные вычислительные сети. Если некоторая локальная сеть непосредственно подключена к глобальной, то и каждая рабочая станция этой сети может быть подключена к ней. Существуют также компьютеры, которые непосредственно подключены к глобальной сети. Они называются хост - компьютерами (host - хозяин). Хост - это любой компьютер, являющийся постоянной частью Internet, т.е. соединенный по Internet - протоколу с другим хостом, который в свою очередь, соединен с другим, и так далее.

Рис. 1. Структура глобальной сети Internet

Для подсоединения линий связи к компьютерам используются специальные электронные устройства, которые называются сетевыми платами, сетевыми адаптерами, модемами и т.д..

Практически все услуги Internet построены на принципе клиент-сервер. Вся информация в Интернет хранится на серверах. Обмен информацией между серверами осуществляется по высокоскоростным каналам связи или магистралям. Серверы, объединенные высокоскоростными магистралями, составляют базовую часть сети Интернет.

Передача информации в Интернет обеспечивается благодаря тому, что каждый компьютер в сети имеет уникальный адрес (IP-адрес), а сетевые протоколы обеспечивают взаимодействие разнотипных компьютеров, работающих под управлением различных операционных систем.

В основном в Интернет используется семейство сетевых протоколов (стек) TCP/IP. На канальном и физическом уровне стек TCP/IP поддерживает технологию Ethernet, FDDI и другие технологии. Основой семейство протоколов TCP/IP является сетевой уровень, представленный протоколом IP, а также различными протоколами маршрутизации. Этот уровень обеспечивает перемещение пакетов в сети и управляет их машрутизацией. Размер пакета, параметры передачи, контроль целостности осуществляется на транспортном уровне TCP.

Прикладной уровень объединяет все службы, которые система предоставляет пользователю. К основным прикладным протоколам относятся: протокол удаленного доступа telnet, протокол передачи файлов FTP, протокол передачи гипертекста HTTP, протоколы электронной почты: SMTP, POP, IMAP, MIME.

3. История появления поисковых систем

Сравнительный обзор поисковых систем

С развитием Интернет в мире, на первое место вышла проблема поиска информации в сети. Эту нишу сразу попытались занять несколько различных крупных фирм, таких как Altavista, Lycos, AOL. Естественно, что каждая из них разработала свои собственные методы для нахождения информации. Это и ручной метод в каталогах, и метод автоматического поиска сайтов в Интернет, и индексации их при помощи специально разработанных для этого "spider"-ов. Их целью было, начиная с нескольких крупных web-узлов, по имеющимся на них ссылкам, группам новостей, проиндексировать весь интернет. Но поскольку, ждать пока такой спайдер доберется до вашего сайта, приходилось очень долго, было принято решение о ручном добавлении сторонними web-мастерами к базе спайдера ссылок, следуя по которым спайдер мог быстро проиндексировать ресурс.

Почти аналогично началось появление подобных систем в СНГ. К ним можно, например, отнести Russian Express, Rambler, Aport и Yandex - так как они тоже используют спайдеров для поиска новых сайтов. Одним из отличий поисковых систем СНГ можно считать то, что они индексируют только сайты СНГ, или проверяют кодировку (язык) текста - как Aport. Вот выдержка из FAQ Yandex:

Яndex ранжирует документы по вычисляемому параметру "релевантность". Релевантность документа зависит не только от числа слов запроса, найденных в документе, но и от частотных характеристик искомых слов, веса слова или выражения, близости искомых слов в тексте документа друг к другу и т.д.

Заголовки типа "type_Document_Title_here", или "Web Page Title Here", или "Insert Page Title Here", или "Put_Your_Title_Here", или "Заголовок" не украшают ни страницу, ни ее Web-мастера. Помимо этого, многие поисковые системы, в том числе и Yandex, обращают особое внимание на слова, содержащиеся в заголовке. Не стоит брать первые 10 самых поисковых слов из какого-нибудь Top100 и вписывать их в заголовки, комментарии, и просто в текст белым по белому. Во-первых, это не добавляет славы создателю и вызывает естественное раздражение пользователей. Во-вторых, поисковые системы, и Яndex тоже, начинают с этим бороться. Кроме этого, спам увеличивает размер документа и, следовательно, уменьшает контрастность слов в нем.

Но кстати, спама избегать тоже необходимо. Более 30 раз повторенное слово на 1-ой страничке, существенно понизит релевантность страницы в целом. И еще, русские поисковые системы не поддерживают мета тэги, поэтому создавая web-страницу на русском языке, позаботьтесь о том, чтобы в title и находились релевантные фразы, а так же чтобы они присутствовали вверху текста.

3.1 История создания поисковой системы GOOGLE

В 1995 г. двое студентов докторантуры Стэнфордского университета - Ларри Пейдж (Larry Page) и Сергей Брин - занимались различными аспектами управления данными. Именно Пейдж в далеком 1996 начал активно использовать Internet для своих исследовательских проектов в области data mining - тогда Web представлял для Пейджа только лишь источник случайно подобранной информации для его разработок. Оба студента входили в рабочую группу MIDAS (Mining Data at Stanford). Немного позже под управлением Раджива Мотвани (Rajeev Motwani), доцента кафедры информатики и вычислительной техники (Computer Science), Пейдж и уроженец Москвы Брин начали разработку собственной поисковой системы. Уже в то время на Internet - рынке присутствовали различные компании, предоставляющие услуги поиска, однако для будущих докторов наук проект был сродни академической забаве - никто и не думал о быстрой капитализации и создании бизнес - плана. Идея, которая легла в основу поисковой машины, была описана в нескольких научных работах и в то же время довольно проста для понимания.

Сеть содержит огромное количество информации, и определить релевантность отдельно взятой странички большинство поисковиков пытаются по наличию в HTML - файле ключевых слов, которые пользователь ввел в форму поиска. Google же индексирует ссылки, исходящие со страницы, считая каждую ссылку на определенный сайт "голосом", увеличивающим ценность сайта, на который ссылаются. Логично предположить, что на сайт популярный и содержащий полезную информацию ссылаться будут чаще, чем на ресурс бесполезный и неинтересный.

Однако этим определение релевантности сайта не исчерпывается. Полученный результат - условный рейтинг популярности ресурсов - также можно использовать и как источник информации о сайтах, на которые эти самые качественные ресурсы указывают. Таким образом, одна ссылка на вашу страницу с сервера Yahoo! или About.com может оказаться более ценной, чем сотни ссылок с неизвестных домашних страничек - в этом случае Yahoo! и About.com рассматриваются как авторитетные источники и, следовательно, содержат ссылки на высококачественные сайты.

В 1998 г. Google запущен на сервере Стэндфордского университета, и его можно найти по адресу google.Stanford.edu. В то время когда другие стартапы получали финансирование, еще не написав бизнес - плана и не разработав собственного продукта, отцы - основатели Google посчитали, что дополнительные исследования работе поисковой машины никак не помешают, и к моменту основания компании поисковый сервер на основе технологии Page Rank уже проработал больше чем два года. Еще в 1996 г. студенты отметили, что их разработка во многих случаях предоставляла более точные результаты, чем остальные поисковики, а в 1997 Google стал внутренним поисковиком Стэндфордского университета. В том же году Пейдж и Брин идут на первые расходы, связанные с дальнейшим развитием Google, они покупают жесткие диски суммарным объемом в 1 ТВ, что обходится им в 15 тыс. долл. Все растраты пока приходится покрывать собственными кредитными карточками.

В сентябре 1998 г. становится понятно, что для того чтобы развивать технологию и дальше, а также начать лицензировать ее заинтересованным сторонам, необходимо создать компанию. Пейдж и Брин за полгода до защиты докторской диссертации уходят из Стэнфорда и забирают с собой Крега Сильверштейна (Craig Silverstein), который назначается техническим директором. В какой-то момент энтузиасты встречают одного из основателей Sun Microsystems Энди Бехтольшайма (Andy Bechtolsheim), и тот после расспросов о дальнейших планах предприятия тут же выписывает экс - студентам чек на 100 тыс. долл. Тот же 1998 г. обозначился в истории развития Internet резким ростом медиа - компаний. Все поисковые машины, которые до этого предлагали своим пользователям возможность найти необходимую информацию в Сети, внезапно решили заняться предоставлением Internet - услуг: бесплатной почты, биржевых котировок, и прочих атрибутов портала. Когда Пейдж встречается с Джорджем Беллом (George Bell), генеральным директором Excite, тот не высказывает заинтересованности в уникальной поисковой технологии. "Пока наша поисковая система находится в более или менее приличном состоянии, нас это устраивает", утверждает Белл, намекая, что собственно поиск перестает быть объектом интереса для порталов.

И Google пришлось идти своим путем. Вместо того чтобы заняться агрессивным маркетингом и продвижением своего проекта, Пейдж и Брин предпочитают нанять на работу около 150 сотрудников, 20 из которых - доктора наук. Компания не рекламирует себя, закупая миллионы баннеров, не заботится о брендинге и рыночном становлении проекта, не собирается зарабатывать деньги путем показа баннерной рекламы на собственном сайте. Несмотря на такую пассивность с точки зрения маркетолога, известность поисковика продолжает расти, и многие пользователи, привыкшие к обращению к нескольким поисковым системам одновременно, выбирают Google, каждый по каким - либо своим субъективным причинам. Кому-то нравится неброский интерфейс и простота использования, кому-то - скорость работы и не перегруженность сайта рекламой, кому-то - качество результатов поиска.

Известный в США эксперт по usability Джейкоб Нильсен (Jacob Nielsen), который входит в Совет директоров Google, как-то, вспоминая о поисковике, говорит: "Их я считаю своими лучшими клиентами. У них вся компания одержима идеей удобства и простоты использования". Более того, убедившись в благосклонности пользователей к поисковикам с простым интерфейсом, компания Altavista выпускает новую оболочку для своей поисковой машины, заявив о Raging Search (#"607685.files/image002.gif">

Рис. 1. Поисковая оптимизация влияет только на основные результаты поиска и не касается платных ссылок, например контекстной рекламы AdWords

Оптимизация сайта должна быть рассчитана на пользователей. Они являются целевой аудиторией сайта, используя поисковые системы для того, чтобы найти его. Излишняя увлеченность специфическими трюками для достижения максимума в топе может не принести желаемых результатов. Оптимизация для поисковых систем - это всего лишь способ быть немного впереди тогда, когда дело касается видимости для поисковых робот.

Название основной страницы сайта может содержать имя сайта или организации, а так же другую полезную информацию, например адрес и краткое описание тематики или услуг.

Рис. 3. Пользователь отправляет запрос [поздравительные открытки]

Рис.4. страница появляется в результатах поиска, название в котором будет первой строкой (заметьте, что слова из поискового запроса выделены жирным)

Рис. 5. Если пользователь решит перейти на другую страницу, ее название появится в заголовке окна браузера

Названия других страниц сайта также должны точно описывать их содержание, и могут содержать название сайта или компании.

Рис. 6. Пользователь отправляет запрос [поздравительные открытки с новым годом]

Рис. 7. В поисковой выдаче появляется релевантная страница нашего сайта (ее название описывает ее содержимое)

3.3 Поисковая система - Yandex

Рис.8. Поисковая система Yandex

Официально поисковая машина Yandex.ru была анонсирована 23 сентября 1997 года на выставке Soft tool. Основными отличительными чертами Yandex.ru на тот момент были проверка уникальности документов. Также ключевые свойства поискового ядра Яndex, а именно: учет морфологии русского языка, поиск с учетом расстояния. Тщательно разработанный алгоритм оценки релевантности (соответствия ответа запросу), учитывающий не только количество слов запроса, найденных в тексте, но и "контрастность" слова (его относительную частоту для данного документа), расстояние между словами, и положение слова в документе. Чуть позже в разделе «Сказки» появилась первая сказка Рунета - «Web - гуманизм или чернуха?». А в разделе «Числа» - первая оценка объема Рунета, 5 тысяч серверов и 4Гб текстов.

Через два месяца, в ноябре 1997 года, был реализован естественно-языковый запрос. Отныне к Yandex.ru можно обращаться просто «по-русски», задавать длинные запросы, например: «где купить компьютер», «генетически модифицированные продукты» или «коды международной телефонной связи» и получать точные ответы. Средняя длина запроса в Yandex.ru сейчас - 2,7 слова. В 1997 году она составляла 1,2 слова, тогда пользователи поисковых машин были приучены к телеграфному стилю. В 1998 году на Yandex.ru появилась возможность «найти похожий документ», список найденных серверов, поиск в заданном диапазоне дат и сортировка результатов поиска по времени последнего изменения. За этот год «объем» Русского Интернета удвоился, что привело к необходимости оптимизации поисковых механизмов. И тогда, и сейчас (при объеме в 200 Гб) скорость поиска на Yandex.ru - доли секунды. За 1999 год Рунет вырос на порядок, как в объемах текстов, так и в количестве пользователей. Это был год бурного развития и для Yandex.ru. Новый поисковый робот позволил оптимизировать и ускорить обход сайтов Рунета. Сегодня поисковая база Yandex.ru вдвое больше, чем у ближайших конкурентов. Новый робот позволил предоставить пользователям новые возможности - поиск по разным зонам текста (заголовкам, ссылкам, аннотациям, адресам, подписям к картинкам), ограничение поиска на группу сайтов, поиск по ссылкам и изображениям, а также выделять документы на русском языке. Появился поиск в категориях каталога, и впервые в Рунете было введено понятие «индекс цитирования» - количество ресурсов, ссылающихся на данный.

Независимо от того, в какой форме вы употребили слово в запросе, поиск учитывает все его формы по правилам русского языка. При этом поиск не ограничен лишь словами или фразами. Яндекс отыщет по названию web-страницу компании или файл с нужной картинкой.

3.4 Поисковая система - Rambler

Рис. 9. Поисковая система Rambler

В 1991 году в городе Пущино появилась группа единомышленников, вдохновленных только что появившейся коммуникационной средой Интернет. Дмитрий Крюков, Сергей Лысаков, Виктор Воронков, Владимир Самойлов, Юрий Ершов. Будущие создатели Рамблера поначалу обслуживали радиотехнические приборы в Институте биохимии и физиологии микроорганизмов РАН. Нормальный, оперативный и эффективный обмен данными был необходим для реализации научных целей. В 1992 году компания запускает собственные ftp- и mail-серверы. Через два года - свой первый www-сервер.

год - ключевой для развития русского киберпространства. Именно в этот год Сергей Лысаков и Дмитрий Крюков принимают решение разработать первую русскую поисковую систему для Интернета.

В тот момент в Рунете уже существовало две-три поисковых машины - но они не выдержали проверки временем и быстро исчезли. А Рамблер развивался, эволюционировал.

Рис. 10. Поисковая система Rambler Top 100

Весной 1997 года появляется Rambler Top100 - уникальный рейтинг-классификатор, который не только оценивает на основе объективных данных популярность российских ресурсов, но и позволяет одним "кликом" попасть на них. Веб - мастера стали более тщательно и вдумчиво работать над своими сайтами, стремясь занять в Топ100 более высокие строчки. Rambler Top100 быстро стал универсальным барометром сети, общим стандартом медиа измерений.

Поисковая система содержит информацию о более чем 12 миллионах документов, расположенных на серверах России и стран СНГ. Рамблер обрабатывает ежесуточно не менее 500 тысяч поисковых запросов, сканируя 48 тысяч web-серверов и используя несколько одновременно работающих программ-роботов.

Запрос может состоять из одного или нескольких слов, разделенных пробелами. Могут быть использованы как русские, так и английские слова и словосочетания. По умолчанию находятся только те документы, в которых встретились все введенные Вами слова. Чтобы найти документы, содержащие хотя бы одно слово из запроса, используйте логическую связку Or или выберите на странице детального запроса: "Слова запроса: любое". Чтобы исключить документы, содержащие те или иные слова, укажите на странице детального запроса: "Исключить документы, содержащие следующие слова...".

Рамблер умеет искать слова во всех формах (например, аминокислота, аминокислоты, аминокислотой и т. д.). Чтобы слово находилось во всех формах, перед ним надо поставить служебный символ "#" . В меню детального запроса такой режим может быть включен для всех слов: "Расширение запроса: все формы слов". Служебный символ "@" перед словом позволяет находить не только само это слово, но и однокоренные слова. В меню детального запроса символу "@" соответствует режим "Расширение запроса: все однокоренные".

По умолчанию наша система ищет слова запроса так, как Вы их ввели, чтобы уменьшить "шум" в найденных документах. Если Вы не помните, как пишется слово, или хотите расширить запрос, можно использовать метасимволы "*" и "?" для обозначения произвольной части слова и произвольного символа.

Ограничить поиск частями документов, такими как название документа, его заголовок, URL и т.п., можно через меню детального запроса "Искать в...".

Можно ограничить поиск документами только на русском или только на английском языке. Для этого надо выбрать соответствующий режим в меню детального запроса "Язык документа...". По умолчанию поиск выполняется по документам на всех языках.

По умолчанию найденные документы сортируются по релевантности. Однако Вы можете потребовать, чтобы вместо этого в начало списка были помещены самые свежие. Для этого надо выбрать соответствующую установку в меню "Сортировать по..." на странице детального запроса.

Вы можете также ограничить поиск документами, созданными в определенный период времени: для этого необходимо на странице детального запроса указать "От даты... до даты...". Можно потребовать, чтобы Рамблер возвращал только те документы, где слова из запроса находятся на минимальном расстоянии друг от друга. Режим "Ограничить расстояние между словами" может быть включен в детальном запросе. Все перечисленные выше правила могут быть использованы совместно друг с другом в необходимой Вам последовательности. По умолчанию результаты поиска выдаются порциями по 15 документов. Меню "Выдавать по..." на странице детального запроса позволяет увеличить это число до 30 или 50. Меню "Форма вывода..." позволяет получать описания документов с увеличенной или уменьшенной подробностью.

3.5 Поисковая система - Yahoo

Рис. 11. Поисковая система Yahoo

Yahoo! - самая известная поисковая машина. Её сайты разбиты по категориям и ключевым словам. Она содержит полезную информацию на своей домашней странице. Может подключаться к другим поисковым машинам.

В ведении находится служба поиска Internet-ресурсов, новостей, карт, рекламных информаций, спортивная информация, бизнес, номера телефонов, персональные WWW-страницы, и email-адреса.

Основная директория содержит: адреса (URL) для Internet-ресурсов и краткое описание для этих связей. Поиск: Все Yahoo страницы предлагают не только простое поисковое окно, но и опции для этого поиска, а также поиск Usenet или Email-адреса. Поиск может ограничиваться указанием определённого промежутка времени. Boolean операторы (и, или) и последовательный поиск также поддержаны. Если Yahoo! не может установить связь достаточно быстро с AltaVista, то в этом случае Yahoo! будет обеспечивать страницу связи с набором инструментов поиска. После того как одна из этих связей выбирается, ключевые слова передаются к поисковой машине на ваше усмотрение.

Средством, облегчающим поиск, является наличие “tip search”(TS) - поиск с помощью “намека”: Yahoo! Является подчиненным справочником, что означает, что система не имеет так много страниц, как поисковые машины, однако задание наиболее общих ключевых слов позволит найти необходимую тему на странице высокого уровня (первая страница, которая возникает перед пользователем при посещении сайта) для организации или компании.

Связи отображаются в соответствии с очерёдностью задаваемых слов последовательностью поиска наряду с их описательным текстом и подчиненной иерархией.

3.6 Поиск по адресам (по URL)

Вы можете искать документы не только по всему русскоязычному Интернету, но и по его части. Самый простой случай - поиск по определенному серверу. Например: url=www.intel.ru собака.

По данному запросу будут найдены все документы на сервере www.intel.ru, содержащие слово "собака". Возможно, вам интересно, а что будет, если написать просто: url=www.intel.ru.

В этом случае вы получите список всех документов, расположенных на указанном вами сервере. Вы можете ограничивать поиск и сильнее - одним из каталогов сервера. Например: url=www.intel.ru/sobaki/ сенбернар.

По данному запросу документы, содержащие слово "сенбернар", будут искаться только в каталоге /sobaki (и его подкаталогах) московского сервера корпорации Intel.

Основные характеристики российских поисковых систем


www.rambler.ru <#"607685.files/image012.gif">

Рис.13. Поисковая система Google

Для начала, нужно решить точно, что вы хотите найти. Например, по слову валенки найдется 131 000 тысяча страниц. По запросу, купить оптом валенки в Суздале, всего 259 страниц. Если вы ищете фразу или цитату, напишите ее в кавычках. Вы можете не набирать запрос целиком, а выбрать его уже из появившихся подсказок

Рис. 14.

Чтобы увидеть ответ прямо в результатах поиска, сразу составляйте вопрос в виде ответа. Например, население санкт-петербурга:

Или Екатерина Великая родилась:


Можно искать не только тексты, но и картинки:

Так же можно искать видео, карты, новости,… В меню расширенного поиска можно задать поиск информации только на определенном языке:

В определенном формате, например, только презентации или же на конкретном сайте.

5. Сохранение информации в сети интернет

Сеть Интернет - как огромная библиотека. Она содержит множество Интернет-сайтов, которые состоят из страниц.

При помощи компьютера и установленных на нем программ, возможно подключиться к Интернету, чтобы просматривать хранящуюся в нем информацию: тексты, картинки, фотографии, музыку, фильмы, а также сохранять их к себе на диск.

Страницы Интернета хранятся не на Вашем компьютере. Он - лишь «окошко», с помощью которого Вы просматриваете сайты.

Если возникают ошибки при вводе информации - это не страшно. Невозможно испортить или изменить что-либо в интернете со своего компьютера. Если закрыть нужную страницу - всегда можно открыть ее заново в прежнем виде, нажав на кнопку «Назад» или повторно набрав ее адрес.

С одной страницы можно переходить на другие при помощи ссылок - обычно ссылки подчеркнуты и выделены цветом.

Когда указатель мышки превращается из стрелочки в значок руки, это значит, что навели его на ссылку. Иногда ссылкой является картинка. Достаточно один раз нажать на ссылку левой кнопкой мыши, и откроется новая страница.

С некоторых сайтов можно также отправлять электронные письма и мгновенные сообщения, размещать на них фотографии и вести дневники.

Интернет - это самый легкий путь для общения с друзьями и коллегами в любой точке мира.

Интернет содержит множество сайтов на самые разные темы.

Заключение

С развитием INTERNET появилась возможность быстрого и удобного поиска необходимой документальной информации. Теперь можно не заниматься подбором и изучением огромного количества литературы в книжных магазинах и библиотеках.

Информацию можно получить, не выходя из дома или офиса. Для этого нужен только непосредственно сам компьютер, подключенный к INTERNET с установленной специальной программой - браузером, предназначеной для просмотра содержимого Web-страниц.

Благодаря разнообразию поисковых систем, специально разработанным для рядового пользователя, каждый может без труда отсечь заведомо ненужный поток информации, лишь правильно сформулировав цель поиска.

Завершая курсовую работу, можно прийти к выводу, что в сети Интернет хранится очень большой объем как учебной информации по различной тематике в виде статей в электронных газетах, отчетов, справочников, графических изображений, аудио- и видео-файлов так и многого другого.

Существуют разные методы поиска учебной информации в сети Интернет: поиск с использованием гипертекстовых ссылок, использование поисковых машин, поиск с применением специальных средств, анализ новых ресурсов.

Рассмотренные мною поисковые машины далеки от совершенства. Считается, что идеальная поисковая машина должна отвечать следующим требованиям:

Простота в использовании

Чётко организованный и обновляемый индекс.

Быстрый поиск в базе данных и быстрое реагирование.

Надёжность и точность результатов поиска.

Масштабы информационных ресурсов и их количество постоянно расширяется. Становится ясно, что база данных не является совершенной. Интеллектуальные агенты - новое направление, лежащее в основе нового поколения поисковых машин, которые могут фильтровать информацию и получать более точный результат. Internet продолжает развиваться с неослабевающей интенсивностью, по сути дела стирая ограничение на распространение и получение информации в мире. Однако в этом информационном океане бывает не очень легко найти необходимый документ, следует также иметь в виду, что в сети наряду с давно действующими серверами возникают новые.

Информационные системы, в которых представлены хранение, и обработка информации осуществляются с помощью вычислительной техники, называют автоматизированными, различные виды деятельности и наиболее бурно развивающиеся отрасли индустрии информационных технологий.

Список использованной литературы

1. Практикум по информатике: Учеб. пособие / Под ред. Курносова А.П. - Воронеж: ВГАУ, 2004. -239 с.

Крупник А.Б. Поиск в Интернете: самоучитель. - 2-е изд. - СПБ.: Питер, 2004. - 572 с.

Орлов А.А. Нужные программы для Интернета - СПб.: Питер, 2006. - 127 с.

Солоницын Ю.А., Холмогоров В. Интернет. Энциклопедия. - 3-е из. - СПб.: Питер, 2003. - 592 с.

Компьютерные сети и средства защиты информации: Учеб. пособие / Камалян А.К., Кулев С.А., Назаренко К.Н. и др. - Воронеж: ВГАУ, 2003. - 119 с.

Попов В. Практикум по Интернет - технологиям: Учебный курс / В. Попов.-СПб.; М.; Харьков; Минск: Питер, 2002. - 476 с.:ил.

Компьютерные сети и средства защиты информации: Учебное пособие / Камалян А.К., Кулев С.А., Назаренко К.Н. и др.-Воронеж: ВГАУ, 2003.-119 с.

Основы современных компьютерных технологий. Под ред. Хомоненко А.Д. - Корона-принт, СПб 1998.

Персональные компьютеры в сетях TCP/IP. Крейг Хант; перев. С англ. - BHV-Киев, 1997.

Павел Храмцов "Поиск и навигация в Internet".://www.osp.ru/cw/1996/20/31.htm

Обучение Интернет - профессиям. Search engine Expert.://searchengine.narod.ru/archiv/se_2_250500.htm

Андрей Аликберов "Несколько слов о том, как работают роботы поисковых машин".://www.citforum.ru/internet/search/art_1.shtml

1. Организатором распространения информации в сети "Интернет" является лицо, осуществляющее деятельность по обеспечению функционирования информационных систем и (или) программ для электронных вычислительных машин, которые предназначены и (или) используются для приема, передачи, доставки и (или) обработки электронных сообщений пользователей сети "Интернет".

2. Организатор распространения информации в сети "Интернет" обязан в установленном Правительством Российской Федерации порядке уведомить федеральный орган исполнительной власти, осуществляющий функции по контролю и надзору в сфере средств массовой информации, массовых коммуникаций, информационных технологий и связи, о начале осуществления деятельности, указанной в части 1 настоящей статьи.

3. Организатор распространения информации в сети "Интернет" обязан хранить на территории Российской Федерации:

1) информацию о фактах приема, передачи, доставки и (или) обработки голосовой информации, письменного текста, изображений, звуков, видео- или иных электронных сообщений пользователей сети "Интернет" и информацию об этих пользователях в течение одного года с момента окончания осуществления таких действий;

2) текстовые сообщения пользователей сети "Интернет", голосовую информацию, изображения, звуки, видео-, иные электронные сообщения пользователей сети "Интернет" до шести месяцев с момента окончания их приема, передачи, доставки и (или) обработки. Порядок , сроки и объем хранения указанной в настоящем подпункте информации устанавливаются Правительством Российской Федерации.

3.1. Организатор распространения информации в сети "Интернет" обязан предоставлять указанную в части 3 настоящей статьи информацию уполномоченным государственным органам, осуществляющим оперативно-разыскную деятельность или обеспечение безопасности Российской Федерации, в случаях, установленных федеральными законами.

(см. текст в предыдущей редакции)

4. Организатор распространения информации в сети "Интернет" обязан обеспечивать реализацию установленных федеральным органом исполнительной власти в области связи по согласованию с уполномоченными государственными органами, осуществляющими оперативно-разыскную деятельность или обеспечение безопасности Российской Федерации, требований к оборудованию и программно-техническим средствам, используемым указанным организатором в эксплуатируемых им информационных системах, для проведения этими органами в случаях, установленных федеральными законами, мероприятий в целях реализации возложенных на них задач, а также принимать меры по недопущению раскрытия организационных и тактических приемов проведения данных мероприятий. Порядок взаимодействия организаторов распространения информации в сети "Интернет" с уполномоченными государственными органами, осуществляющими оперативно-разыскную деятельность или обеспечение безопасности Российской Федерации, устанавливается Правительством Российской Федерации.

4.1. Организатор распространения информации в сети "Интернет" обязан при использовании для приема, передачи, доставки и (или) обработки электронных сообщений пользователей сети "Интернет" дополнительного кодирования электронных сообщений и (или) при предоставлении пользователям сети "Интернет" возможности дополнительного кодирования электронных сообщений представлять в федеральный орган исполнительной власти в области обеспечения безопасности информацию, необходимую для декодирования принимаемых, передаваемых, доставляемых и (или) обрабатываемых электронных сообщений.

4.2. Организатор распространения информации в сети "Интернет" в случае осуществления деятельности по обеспечению функционирования информационных систем и (или) программ для электронных вычислительных машин, которые предназначены и (или) используются для обмена электронными сообщениями исключительно между пользователями этих информационных систем и (или) программ для электронных вычислительных машин, при котором отправитель электронного сообщения определяет получателя или получателей электронного сообщения, не предусматриваются размещение пользователями сети "Интернет" общедоступной информации в сети "Интернет" и передача электронных сообщений неопределенному кругу лиц (далее - организатор сервиса обмена мгновенными сообщениями), также обязан:

1) осуществлять идентификацию пользователей сети "Интернет", передачу электронных сообщений которых осуществляет организатор сервиса обмена мгновенными сообщениями (далее - пользователи сервиса обмена мгновенными сообщениями), по абонентскому номеру оператора подвижной радиотелефонной связи в порядке , установленном Правительством Российской Федерации, на основании договора об идентификации, заключенного организатором сервиса обмена мгновенными сообщениями с оператором подвижной радиотелефонной связи, за исключением случаев, предусмотренных настоящим Федеральным законом;

2) в течение суток с момента получения соответствующего требования уполномоченного федерального органа исполнительной власти ограничить возможность осуществления пользователем сервиса обмена мгновенными сообщениями, указанным в этом требовании, передачи электронных сообщений, содержащих информацию, распространение которой в Российской Федерации запрещено, а также информацию, распространяемую с нарушением требований законодательства Российской Федерации, в порядке, определенном Правительством Российской Федерации;

3) обеспечивать техническую возможность отказа пользователей сервиса обмена мгновенными сообщениями от получения электронных сообщений от других пользователей;

4) обеспечивать конфиденциальность передаваемых электронных сообщений;

5) обеспечивать возможность передачи электронных сообщений по инициативе государственных органов в соответствии с законодательством Российской Федерации;

6) не допускать передачу электронных сообщений пользователям сервиса обмена мгновенными сообщениями в случаях и в порядке, которые определены Правительством Российской Федерации.

4.3. Организатор сервиса обмена мгновенными сообщениями, являющийся российским юридическим лицом или гражданином Российской Федерации, вправе осуществлять идентификацию пользователей сервиса обмена мгновенными сообщениями самостоятельно путем определения абонентского номера подвижной радиотелефонной связи пользователя сервиса обмена мгновенными сообщениями. Правительством Российской Федерации могут устанавливаться требования к порядку определения абонентского номера подвижной радиотелефонной связи пользователя сервиса обмена мгновенными сообщениями организатором сервиса обмена мгновенными сообщениями, являющимся российским юридическим лицом или гражданином Российской Федерации.

4.4. Организатор сервиса обмена мгновенными сообщениями, являющийся российским юридическим лицом или гражданином Российской Федерации, обязан хранить сведения об идентификации абонентского номера подвижной радиотелефонной связи пользователя сервиса обмена мгновенными сообщениями (далее - идентификационные сведения об абонентском номере) только на территории Российской Федерации. Предоставление третьим лицам идентификационных сведений об абонентском номере может осуществляться только с согласия пользователя сервиса обмена мгновенными сообщениями, за исключением случаев, предусмотренных настоящим Федеральным законом и другими федеральными законами. Обязанность предоставить доказательство получения согласия пользователя сервиса обмена мгновенными сообщениями на предоставление третьим лицам идентификационных сведений об абонентском номере данного пользователя сервиса обмена мгновенными сообщениями возлагается на организатора сервиса обмена мгновенными сообщениями.

В дата-центре хранится абсолютно вся информация, выкладываемая в сеть. Это ваши личные фотографии, загруженные документы, записи разговоров по Скайпу, комментарии в блогах и прочие важные и неважные данные. По сути, дата-центр – это такой большой банк, хранилище контента. Создавая такие хранилища, разработчики преследовали несколько целей: круглосуточную доступность, защиту доступа, сохранение информации и целостности файлов.

Поскольку ценная информация существует, то обязательно найдутся те, кто захочет ее похитить. За безопасность дата-центров отвечают не военные или солдаты, а высокоинтеллектуальные hight-tech охранники, работающие под прицелом видеонаблюдения и систем контроля. Обязанность охранников заключается в том, чтобы обеспечить конфиденциальность и полную неприкосновенность контента.

Технические условия работы дата-центра

Существуют жесткие правила, регламентирующие работу дата-центров. Предприятия должны обеспечиваться электроэнергией бесперебойно. Дата-центры уровня Tier4 (четвертого уровня) получают сразу от двух электростанций. Такая двойная подстраховка нужна для того, чтобы исключить вероятность отключения от электроэнергии в случае выхода из строя одной из электростанций.

Дата-центры оборудуются современными системами газового тушения пожара. Газовые системы пожаротушения предусматривают засыпание порошком углекислоты источника возгорания во избежание порчи остального оборудования. Порошок углекислоты традиционно используется в огнетушителях для тушения подключенного к электроэнергии оборудования.

Большое внимание уделяется климат-контролю. Во время работы жесткие диски и серверы выделяют тепло, которое удаляется при помощи систем кондиционирования и вентиляции. Летом по ночам используется прохладный фильтрованный воздух улицы, зимой морозный воздух смешивается с теплым внутренним.

На чем зарабатывают «хранители информации»

Дата-центры работают на коммерческой основе. Они сдают в аренду места в сетевых хранилищах или на жестких дисках. При желании можно взять в аренду целый сервер, место в стойке под собственный сервер или арендовать бокс. В последнем случае к стоимости аренды добавляется стоимость электроэнергии (с небольшой наценкой).

В последнее время приобрела популярность такая услуга, как аренда части программного обеспечения. Дата-центры покупают лицензионные программы, устанавливают их на своих серверах и сдают частями в аренду. Еще одна популярная услуга – аренда виртуального сервера, то есть определенной доли ресурса сервера.

Вот список известных мне сервисов хранения информации в интернете:

Есть возможность синхронизации папки с сервером и разными компьютерами, что удобно при использовании нескольких компьютеров. Для синхронизации нужно установить программу Яндекс.Диска себе на компьютер – она создаст папку, которая будет синхронизироваться. Плюс, установка этой программы даёт увеличение первоначального объема Диска, но потом её можно удалить и он станет вашим внешним хранилищем файлов. Кстати, если вы сделаете себе Диск по моим ссылкам, то получите дополнительный объем в 1 Гб, а я 0.5 Гб (при условии установки программы на свой компьютер ) – так Яндекс раскручивает своё хранилище. Я уже пользуюсь этим сервисом – очень удобно, рекомендую !

3. Файлы QIP – http://file.qip.ru. Бесплатно дается для хранения 2 Гб свободного места на файлы абсолютно любого типа на срок 30 суток. Для продления срока нужно файл скачать хоть один раз. Для увеличения сроков и объемов сохраняемой информации существуют платные премиум-аккаунты, в которых вам за 25$ дадут 100 Гб места. Для доступа к сервису нужно иметь аккаунт QIP, а для непосредственной загрузки из своего QIP-клиента нужно установить себе QIP-Infium. Тоже удобная возможность удаленного доступа к информации из любой точки мира. Сервис прекратил свою работу

4. Файлы ex.ua – украинский БЕСПЛАТНЫЙ сервис хранения НЕОГРАНИЧЕННОГО ОБЪЕМА информации. Файлы могут быть ЛЮБОГО размера и ЛЮБОГО формата. Для доступа просто зайдите на страницу сервиса и нажмите кнопку Создать, загрузите ваши данные и запишите ключ и ссылку доступа к вашим данным. Система сама запоминает ваш компьютер и в последствии только с него можно редактировать или удалить вашу информацию. Имея ссылку доступ получите отовсюду. Срок хранения ограничен 30 сутками. Для продления просто скачайте по разу ваши файлы. Очень простой и удобный сервис!

9. – тоже способ хранения информации, причем не только бесплатный, но и приносящий прибыль. Поскольку все аккаунты файлообменников ваши, то доступ к вашей информации вы имеете всегда,в любом объеме и из любого места. Ограничения по объему, срокам и условиям в файлообменных сервисах свои, поэтому более подробно вы с ними ознакомитесь в каждом из них.

Вот так, используя просторы Сети можно хранить файлы в интернете, сохраняя свой жесткий диск в свободе и легкости.

P.S. Прочитайте ещё и у вас появится 100 25 Гб абсолютно бесплатного места для хранения файлов в Интернете от сервиса mail.ru

Если эта статья вам помогла, то помогите и вы автору – получите блога и расскажите про блог своим друзьям социальными кнопочками, вдруг, им тоже поможете!

С уважением, Алексей Гончаров.

Пройдись по кнопочкам, расскажи о статье друзьям - это к деньгам!