Поисковая система - это программно-аппаратный комплекс, предназначенный для осуществления поиска в сети Интернет и реагирующий на запрос пользователя, задаваемый в виде текстовой фразы (поискового запроса), выдачей списка ссылок на источники информации, в порядке релевантности (в соответствии запросу). Наиболее крупные международные поисковые системы: «Google», «Yahoo», «MSN». В русском Интернете это – «Яндекс», «Рамблер», «Апорт».
Как работают поисковые системы интернет
• Сканирование веб-ресурсов;
• Формирование индекса;
• Предоставление выдачи ранжированной для поискового запроса.
Сканирование
Сканирование веб-ресурсов, осуществляют поисковые роботы (Spider, Crawler, Bot, Robot). Это специальные программы, которые периодически обходят веб-страницы, формируют из них индекс страниц, возможно, делают скан текста.
Обход страниц осуществляется с определенной периодичностью. Чаще других обходят страницы боты Google. Основанием для обхода являются гиперссылки на страницы. При обходе страниц все встречающиеся ссылки боты фиксируют, из ссылок формируются списки для следующих обходов.
Именно по этому, ссылка на новую страницу сайта с уже проиндексированной страницы ускоряет её индексацию. Также, наличие большого количества мертвых ссылок на сайте, формирует негативный образ сайта, и такой сайт обходится ботами реже. Кроме этого, поисковые роботы обращают внимание на sitemap сайта и используют его, как вспомогательный навигатор для поиска новых ссылок для обхода.
Индексирование
Из всех страниц, которые обходит Bot, формируется база данных поисковой системы. В базе данных находятся все страницы, которые боты «просеяли» через «крупное сито» и посчитали, возможно, интересными для выдачи.
Из этой базы данных, следующая группа программ, формирует индекс поисковой системы — те веб-страницы, которые будут показаны в выдаче.
Индексирование страниц происходит по уникальным алгоритмам поисковых систем. Алгоритмы индексирования часто меняются, особенно у Яндекс, из-за чего индекс поисковика может претерпевать серьезные изменения.
Ранжирование страниц и их выдача
Последняя группа программ, формируют из индекса поисковую выдачу по сделанному поисковому запросу.
Стоит отметить, что, несмотря на заявленные интеллектуальные способности некоторых поисковых алгоритмов, для релевантного поиска своему запросу, нужно пользоваться языком поисковых запросов. Записывая запрос специальным образом, вы более конкретно поясняете боту, что вам нужно.
Но даже без этого, программы ранжирования и выдачи, подбирают по сделанному запросу список веб-ресурсов, которые, по их мнению (алгоритму), соответствуют сделанному запросу. Расстановка ресурсов в списке выдачи называют ранжирование, а соответствие ресурса запросу, называют релевантностью.
Google можно по праву назвать самой популярной поисковой системой в мире. Созданное в Америке и адаптированное, в первую очередь, под американцев и англоязычное население, системное обеспечение Google постепенно перестраивается, покоряя и русскоязычную аудиторию.Его можно смело назвать прямым и самым активным конкурентом Яндекса. Кроме того, этот поисковик- одна из самых дорогих компаний в мире. Можно представить, какими активами владеет ее руководство, если по оборотам за прошлый год они обошли даже Apple!
Достоинства использования поисковой системы Google:
• Специализированные роботы сканируют и оценивают содержание страниц для поискового индекса;
• Главный плюс – очень короткое время отклика системы на запрос;
• Поиск информации по запросу в PDF-файлах;
• Google организует поиск на десяти различных языках – это максимальный результат;
• Поисковик показывает наиболее высокие результаты по чистоте, релевантности и точности поиска;
• Поисковая система имеет собственную почту, облачное хранилище, браузер, карты и прочие сервисы;
Недостатки Google:
• Постоянное усовершенствование систем и добавление различных фильтров в значительной мере усложняет работу и затрудняет продвижение сайтов;
• Обширная информационная база препятствует точному поиску, засоряя «эфир» огромным количеством несоответствующих запросу ссылок.
Типы поиска Google
На странице поиска Google мы видит несколько типов поиска:
• Традиционный: поиск по веб-сайтам и веб-страницам;
• Поиск «Мне повезёт: мотиватор поиска;
• Картинки: поиск по базе данных фотографий Google.
Общий принцип работы поисковой системы Яндекс, можно разделить на два процесса. Первый это обход Интернет поисковыми роботами с целью сбора информации, а точнее сканирования веб-ресурсов. Второй это отдача ответа пользователю, по сделанному поисковому запросу.
Плюсы Yandex:
• Огромное количество сервисов системы, самые популярные из которых – почта, маркет, карты, диск, браузер и другие, значительно превосходящие основных конкурентов;
• Создание виджетов (блоков новостей) на главной странице Yandex;
• Высокая информативность Яндекса;
• Удобное и компактное расположение результатов поиска;
• База поисковой системы – индекс –которую формирует поисковый робот. Он анализирует и собирает информацию в Сети с определенной периодичностью. При выдаче информации пользователю робот учитывает язык пользователя, его местоположение, прошлую активность и историю запросов. Каждый результат создается индивидуально! Такого подхода не встретишь ни у одного другого поисковика;
• Необходимо добавить, что Yandex обладает еще одной очень ценной характеристикой: он исправляет орфографические ошибки и предлагает возможные варианты. Это крайне удобно, если вы ищете информацию по термину, в написании которого вы не уверены. Google в этом отношении не надежен и запросто может предложить несколько десятков страниц результатов на неверный запрос. Так что плюсы пользования системой Yandex очевидны;
• Ну, и по мелочи: удобный и красивый интерфейс, надежный хостинг, отсутствие спама в поиске и нераздражающее количество коммерческой информации;
• Удобный поиск по сервисам: картинки, каталог, новости, маркет, энциклопедия.
Недостатки Yandex
• Постоянно появляющаяся CAPTCHA отнимает время и раздражает пользователей;
• Для тех, кто сайты «делает» и продвигает очень сложно раскрутить новый ресурс именно на Яндексе, система крайне подозрительно воспринимает «юные» сайты;
• Сбои в поиске порою приводят к тому, что в топе оказываются откровенно никчемные сайты, а популярные еще вчера площадки стремительно скатываются в рейтинге. Впрочем, так же неожиданно они возвращаются на ранее занимаемые места.
Поисковой системы Рамблер НЕ существует с 2011 года.Есть медийный портал Рамблер, с массой новостей. Есть форма поиска, которая есть не что иное, как обрезанный поиск Яндекс. Самостоятельных роботов и программ у Рамблер нет.
Положительные стороны Rambler:
• Большой опыт работы;
• Новая технология анализирует поведение пользователя и определяет его пол и возраст;
Отрицательные стороны Rambler:
• Поисковик морально устарел, не выдержав конкуренции со стороны отечественных и западных поисковых систем;
• Тестирование Рамблера указывает на низкое индексирование динамических сайтов.
|