Российская поисковая система сети интернет. Лучшие поисковые системы

17.12.2017 17:00:00

Современный Интернет сложно представить без поисковых систем. Ежедневно они обрабатывают миллиарды запросов, поступающие через десктопные браузеры и мобильные приложения. Сложнейшие алгоритмы буквально предугадывают действия пользователей, подсказывают возможные варианты вводимых данных и выдают наиболее точные результаты.

Но какая самая лучшая поисковая система функционирует в Сети на сегодняшний день? Почему мы отдаем предпочтение какому-то определенному поисковику? В нашей статье мы разберем какие поисковые системы завоевали наибольшую популярность и в чем их принципиальные отличия.

Рейтинг поисковых систем в мире

Для начала выясним, какие поисковики пользуются самой большой популярностью в мире. Для этого обратимся к данным, которые предоставляет авторитетное аналитическое агентство NetMarketShare. В данной таблице выведен топ-5 поисковиков и процент запросов пользователей персональных компьютеров за 2017 год:

Нетрудно заметить, что по обеим позициям поисковик от Google лидирует с максимальным отрывом от своих конкурентов. Более того, для мобильных устройств Google, по сути, является монополистом, обрабатывая 93% всех поисковых запросов. Связано это и с широким распространением смартфонов на ОС Андроид.

Кроме того, Google – один из самых минималистичных поисковиков. На главной странице пользователь видит лишь логотип и строку поиска. Также пользователей привлекают интересные дудлы – логотипы Google, которые перерисоваются в честь определенной даты или события. Очень часто такие дудлы делают интерактивными. Таким образом, по всем вышеуказанным показателям Google – это однозначно лучшая поисковая система.

На втором месте по популярности, как на ПК, так и на смартфонах, прочно утвердился китайский поисковик Baidu. Дело в том, что данный сервис является единственно доступным в Китае – им пользуются 92% всего населения. Время от времени Baidu пытается расширить географический границы, однако популярности в других странах он так и не снискал. Во многом это связано с довольно агрессивной политикой продвижения и конфликт расширений поисковика с антивирусами.


Bing – поисковик от Microsoft, которым чаще всего пользуются владельцы персональных компьютеров в США. Небольшой процент запросов с мобильных устройств обусловлен тем, что смартфоны от Microsoft постепенно уходят с рынка.


Yahoo! – один из старейших поисковиков, который был создан в 1995 году. В основном, им пользуются жители США, Великобритании и некоторых стран Юго-Восточной Азии.

Поисковик от Яндекс попал только в первую пятерку по запросам с ПК. Небольшой процент от общего количества запросов также обусловлен тем, что отечественным поисковиком пользуются пользователи России и стран СНГ. А замыкает топ-5 по популярности поисковиков для мобильных устройств сервис Dogpile. Его основная аудитория – жители США, Канады и Европы.

Рейтинг поисковых систем в России

Выяснить, какая лучшая поисковая система в российском интернет-сегменте Рунете нам помогут данные счетчика LiveInternet и аналитического сервиса Seo-auditor.

Счетчик LiveInternet учитывает поисковые запросы как с ПК, так и с мобильных платформ. В итоге, рейтинг популярности поисковиков в России выглядит так:


С большим отрывом лидируют два главных конкурента – Google и Яндекс. Оба поисковика отличаются высокой скоростью и эффективностью работы. Кроме того, каждый сервис обладает своими уникальными «фишками». Например, поисковик от Гугл выдает четкую и лаконичную информацию о каждом сайте, а также учитывает качество страниц в выдаче. Яндекс же большое внимание уделяет своим дополнительным сервисам, которые подключаются при каждом запросе в поисковике.

На третьем месте по популярности оказался поисковик от Mail.ru. Многие эксперты отмечают у данного сервиса хорошо проработанные поисковые алгоритмы, быстрое обновление новостей на главной странице. С другой стороны, хватает у Mail и недочетов. В первую очередь, это нехватка дополнительных сервисов и недоработанный анти-спам фильтр.

Некогда популярный Rambler сейчас обрабатывает всего 0,2% от общего количества поисковых запросов в Рунете. Некоторое время назад сервис сделал капитальный ремонт: у поисковика сменился логотип и была с нуля перерисована главная страница. Однако подняться в рейтинге поисковых систем это, увы, не помогло.


Тем не менее, у Рамблера есть свои очевидные достоинства. Например, ассоциативная система поиска. Если пользователь забывает сменить раскладку и вбивает слово vepsrf, поисковик выдает результаты по запросу «Музыка». Сейчас этой системой уже никого не удивишь, вот только Рамблер был первым поисковиком в Рунете, который смог качественно реализовать такой алгоритм.

Меньше 200 тысяч запросов в год обработал поисковик Bing. Как уже говорилось выше, сервис от Microsoft популярен, в основном, на Западе, и, скорее всего, большая часть запросов в Рунете через Bing отправляется со смартфонов и ПК иностранцев, работающих в России.

Схожие данные по популярности поисковиков можно наблюдать в исследовании аналитического агентства Seo-auditor. Сравните цифры по состоянию на январь и ноябрь 2017 года:

Сопоставив данные счетчиков Яндекс.Метрика, SpyLog/Openstat, LiveInternet, Hotlog, Рейтинг@Mail.ru, а также с помощью оригинальных алгоритмов, специалисты Seo-auditor пришли к выводу, что звание «Самая лучшая поисковая система» в Рунете вновь делят между собой Google и Яндекс. К тому же заметно, как за год уменьшилась доля запросов через поисковики Мейл, Рамблер и Бинг.

Мобильные приложения-поисковики

Среди первой пятерки самых популярных поисковых систем фирменные мобильные приложения имеются у Google , Яндекс и Bing . Чтобы выяснить, чем отличается каждая утилита, мы протестировали поисковики на мощном и производительном смартфоне . В качестве тестового запроса мы использовали один из самых популярных, на данный момент, не только в России, но и во всем мире – Звездные Войны 8. Результат можно посмотреть на видео ниже:

Google в своем мобильном поисковике руководствуется тем же принципом, что и в десктопной версии - минимум элементов интерфейса. Поисковый запрос можно вводить как с экранной клавиатуры, так и голосом. В выдаче поисковика можно проследить четкую иерархию:

  • Обзоры и рейтинги фильма
  • Расписание сеансов в кинотеатрах города
  • Трейлеры на YouTube
  • Список актеров фильма
  • Похожие запросы
  • Ссылки на сайты.

Похожую картину можно наблюдать и в поисковике от Яндекса. Российский сервис в своем приложении также копирует основную версию. На главном странице размещены полезные сервисы и новости, а поисковая строка закреплена внизу экрана. Результаты по выдаче распределяются так:

  • Трейлеры и ролики на Яндекс.Видео
  • Расписание сеансов в кинотеатрах
  • Ссылка на Википедию
  • Список актеров
  • Похожие запросы
  • Ссылки на сайт (причем первой ссылкой значится страница фильма на Кинопоиске, который принадлежит Яндексу).

Отдельной «фишкой» Яндекса можно назвать голосовой помощник Алиса, с помощью которого можно не только найти нужную информацию, но и скоротать время в приятной, а иногда и забавной беседе с цифровым алгоритмом.


Приложение Bing, так же как и Гугл, идет по пути лаконичности. На главном экране размещена кнопка поиска на красивом фоне. По нажатию на увеличительное стекло пользователь попадает на страницу поисковика. Несмотря на то, что интерфейс не русифицирован, приложение быстро выдает нужные результаты. Правда, в отличие от Гугла и Яндекса, Bing ограничивается лишь ссылками на сайты без дополнительно включенных сервисов.

Альтернативные поисковики

Помимо самых популярных поисковиков вроде Яндекса и Гугла в Сети существует немало интересных поисковых сервисов, которые по своим функциям могут стать неплохой альтернативой признанным гигантам. Мы выбрали 5 самых интересных систем, которыми можно пользоваться как на ПК, так и на смартфонах.


Поисковик, который базируется на трех основных принципах:

  • Отсутствие хранилища личных данных
  • Отсутствие навязчивой рекламы на основе запросов пользователя
  • Отсутствие отслеживания действий пользователя.

Таким образом, DuckDuckGo оценят те, кто предпочитает конфиденциальность в Сети и хочет получать объективную информацию, без учета прошлого поискового поведения в Интернете. Кроме того, DuckDuckGo не привязан географически к пользователю. Это значит, что информацию можно искать и получать на любом языке, в то время как Яндекс и Гугл отдают предпочтение русскоязычным ресурсам, даже если вбить запрос на английском.

YaCy

Децентрализованный поисковик, у которого нет единого сервера и владельца. YaCy это сеть компьютеров пользователей, на которых установлена специальная программа. Каждый ПК самостоятельно сканирует Сеть и собирает полученную информацию в общую базу данных. Каждый узел сети YaCy автономен и, следовательно, не подвержен государственной или корпоративной цензуре.

Единственный недостаток для отечественного пользователя – YaCy не русифицирован.

Pipl


Pipl – это система, которая создана для поиска конкретных пользователей в Сети. Сложные алгоритмы собирают все данные о человеке по профилям в соцсетях комментариям, открытым базам данных, и так далее. На данный момент, в поисковой базе Pipl собраны данные по более чем 3 миллиардам человек.

Поиск по Рунету для Pipl является пока еще довольно сложной задачей. Так что данный поисковик станет более полезен тем, кто ищет конкретных пользователей в Европе, США или Канаде.

Вопросно-ответная система, поисковик на основе базы знаний и наборе вычислительных алгоритмов. В отличие от остальных поисковых систем, Wolfram|Alpha не выводит список ссылок по запросам, а формирует полноценный ответ на основе базы знаний об истории, культуре, науке, кинематографии, театре и многом другом. Кроме того, алгоритм подключает данные об известных людях и страницах в Сети.

Например, на запрос Star Wars films поисковик выдает список всех фильмов киновселенной, по каждому из которых можно посмотреть индивидуальную информационную карточку. Следом идет подборка постеров фильмов и подробная информация о сборах в кинотеатрах.

Wolfram|Alpha постоянно пополняет свою базу данных для более точного вывода самой необходимой информации по запросам. Для студентов, журналистов, аналитиков и научных сотрудников Wolfram|Alpha – пожалуй, лучший поисковик, так как он выдает не только текстовую информацию, но и компилирует различные графики, таблицы и схемы для большей наглядности.

Мы познакомили вас с самыми популярными поисковыми системами. Конечно, довольно сложно назвать определенный поисковик лучшим в мире. У каждой системы есть свой набор инструментов, которые привлекают тех или иных пользователей. А каким поисковиком чаще всего пользуетесь вы? Расскажите о своих впечатлениях в комментариях к данной статье!

Еще совсем недавно эрудиция была в большой цене. Но сегодня знание всех мировых столиц и мельчайших исторических подробностей является абсолютно бесполезным. Вместо того чтобы пичкать свой мозг никому не нужными фактами, достаточно лишь знать, какие есть поисковики в интернете. Все остальное решит умнейший программный алгоритм.

Краткое описание поисковых систем

Поисковая система - это программная система, которая предназначена для поиска информации во Всемирной Паутине. Результаты запроса, как правило, представлены в виде страницы выдачи, состоящей из десятка коротких текстовых блоков (сниппетов) в сочетании с мультимедийным контентом.

Сегодня насчитывается около полутора десятка международных инструментов поиска данных. Все они действуют по одним и тем же принципам:

  1. За сбор информации отвечает краулер - робот (проще - специальная программа), который «ползает» с сайта на сайт и заносит в индекс различные типы данных (содержание страницы, программные сценарии, мета-теги и др.);
  2. После добавления в индекс, информация становится доступной для рядового пользователя через интерфейс поисковой строки;
  3. Выдача на странице результатов ранжируется особым образом. Ключевым показателем является релевантность - соответствие первоначальному запросу.

Как пользоваться поисковиком?

Разработчики этих систем сделали все возможное, чтобы работать с ними мог каждый, даже ребенок. И, нужно сказать, им это удалось:

  1. Для того чтобы обратиться к разуму поисковой машины, достаточно перейти на ее официальный сайт. Дизайн стартовых страниц может отличаться, но строка для ввода текста обязательно будет на самом видном месте;
  2. Еще более простой способ - задание запроса через адресную строку браузера. Большинство современных обозревателей поддерживают данную функцию;
  3. Если набор текста в конкретной ситуации затруднен или невозможен, можно воспользоваться функцией голосового ввода (запускается по нажатию иконки с микрофоном);
  4. Спустя доли секунды после обращения система выдаст результаты;
  5. Для ускорения поиска можно использовать логические операторы. Так, добавление знака «минус» перед словом исключит его из выдачи, знака «плюс» - сообщит поисковой машине, что данное слово обязательно должно быть в искомом тексте, а словосочетание в кавычках запускает поиск по точной фразе;
  6. Если найти нужную информацию не удалось - не беда. Никто не мешает воспользоваться другой службой. Приведем обзор главных игроков на этом рынке.

Обзор ключевых сервисов

На рубеже веков практически каждое государстве имело свой национальный поисковик. Однако по прошествии нескольких лет конкуренция оставила лишь нескольких глобальных игроков:

  • Google - неоспоримый лидер рынка. На него приходится львиная доля мирового поискового трафика. В развитых странах его доля колеблется от 80 до 90%. В России успехи машины не столь впечатляющи: лишь 40% доля;
  • Yandex - основной конкурент для Google в России, на данный момент занимает лидирующее место, по из-за смены поискового алгоритма в 2017 году постепенно стал терять свои позиции;
  • ‒ занимает третье место в рунете (около 5%), поиск от известной российской компании, входит в состав Mail.Ru Group, которой принадлежат социальные сети «Вконтакте», «Одноклассники», поисковик Nigma (про него опишем ниже), платежная система Qiwi и много чего другого.
  • Bing - служба от компании «Майкрософт». Лучшие результаты выдает прежде всего на английском языке. Русскоязычный сегмент практически не развит. Это, однако, не мешает Bing быть поисковиком № 2 в мире (7%);
  • Далее с небольшим отрывом следует китайская компания «Байду » , которая обслуживает в основном рынки Восточной Азии (Китай и Япония). На Западе и в России она мало известна;
  • Yahoo! - стояла у истоков современной сферы высоких технологий, но проиграла в конкурентной борьбе. Сегодня использует решение от «Майкрософт»;
  • Nigma - некогда популярная поисковая система, основанная российскими программистами в 2005 году, теперь почти потерявшая долю трафика;
  • Duckduckgogo - позиционирует себя как сервис, бережно относящийся к персональным данным юзеров (отсутствует сбор кэша и персонализация).

Яндекс: «наше все» в рунете

Разговор о поиске информации в сети был бы неполным без упоминания ключевого игрока на российском рынке - Яндекса. Ее основатели Аркадий Волож и Илья Сегалович запустили совместное предприятия задолго до появления на свет бренда Google. За много десятков лет поисковик выбился в топ крупнейших в мире (№4 с 2014 года).

Основная причина такого феномена заключается в высочайшем качестве сервиса:

  • Яндекс первым запустил поиск с учетом русской морфологии. Эта новация позволила ему в 2001 году обскакать тогдашнего гиганта IT-индустрии Рамблера;
  • С 2009 года служба стала учитывать регион проживания пользователя. Благодаря этому региональные сайты получили импульс к развитию;
  • В том же году был запущен алгоритм машинного обучения «Матрикснет», который значительно увеличил скорость и качество работы сервиса;
  • Параллельно развивался англоязычный сайт, для которого Яндекс арендовал офис в Калифорнии;
  • В 2012 году результаты запроса стали учитывать персональные предпочтения конкретного юзера.

Популярность системы постоянно растет: с 2001 по 2017 годы объем трафика увеличился в 280 раз. Но, как мы писали ранее, после кардинальной смены алгоритма в 2017 году, Яндекс стал терять долю своих посетителей в пользу Гугл, посмотреть полную статистику трафика рунета на текущий момент можно по ссылке .

Как удалить информацию о себе из поисковика?

Интернет является не только благом для всего человечества, но и потенциальным источником угроз. Некоторые из них создают значительную опасность для персональных данных рядовых пользователей. После попадания в сеть даже самые оскорбительные сведения удалить невозможно.

Так, по крайней мере, было до недавнего времени. С января 2016 года в России действует закон «О праве на забвение». Теперь каждый человек, которого не устраивает его репутация в виртуальном мире, может очистить ее вполне легальным способом. Для этого необходимо:

  1. Подать соответствующее заявление организацию, оказывающую поисковые услуги;
  2. Приложить все возможные доказательства ложности и неактуальности данных, которые предлагается удалить из выдачи;
  3. Большинство поисковиков облегчают задачу пользователям. Отправить соответствующую просьбу можно через специальную форму онлайн (для Яндекса);
  4. На протяжении десяти дней компания будет проверять заявление на наличие законных оснований;
  5. При положительном исходе информация подлежит удалению из индекса;
  6. Если оснований для удаления не установлено, организация уведомляет об этом заявителя.

Бессменный ведущий программы «Умницы и умники» Юрий Вяземский в одном из интервью упомянул, как обнаружил необычное слово у Булгакова и пытался найти его значение. Работа в библиотеке заняла целый год (!). Сегодня представить такую ситуацию невозможно: в интернете есть множество поисковиков. Один клик - и каждый может подключиться к мировому разуму.

Видеообзор анонимных поисковых систем

В данном ролике Антон Морозов расскажет, какие существуют поисковики, сохраняющие полную конфиденциальность пользователя:

Уже давно стали неотъемлемой частью российского Интернета. Поисковые системы сейчас – это огромные и сложные механизмы, представляющие собой не только инструмент поиска информации, но и заманчивые сферы для бизнеса.

Большинство пользователей поисковых систем никогда не задумывались (либо задумывались, но не нашли ответа) о принципе работы поисковых систем, о схеме обрабатки запросов пользователей, о том, из чего эти системы состоят и как функционируют…

Данный мастер-класс призван дать ответ на вопрос о том, как работают поисковые системы. Однако, Вы не найдете здесь факторов, влияющих на ранжирование документов. И тем более не стоит рассчитывать на подробное объяснение алгоритма работы Яндекса. Его, по словам Ильи Сегаловича, - директора по технологиям и разработке поисковой машины «Яндекс», можно узнать, лишь «под пыткой» самого Ильи Сегаловича…

2. Понятие и функции поисковой системы

Поисковая система - это программно-аппаратный комплекс, предназначенный для осуществления поиска в сети Интернет и реагирующий на запрос пользователя, задаваемый в виде текстовой фразы (поискового запроса), выдачей списка ссылок на источники информации, в порядке релевантности (в соответствии запросу). Наиболее крупные международные поисковые системы: «Google» , «Yahoo» , «MSN» . В русском Интернете это – «Яндекс» , «Рамблер» , «Апорт» .

Рассмотрим подробнее понятие поискового запроса на примере поисковой системы «Яндекс». Поисковый запрос должен быть сформулирован пользователем в соответствии с тем, что он хочет найти, максимально кратко и просто. Допустим, мы хотим найти информацию в «Яндексе» о том, как выбрать автомобиль. Для этого, открываем главную страницу «Яндекса», и вводим текст поискового запроса «как выбрать автомобиль». Далее, наша задача сводится к тому, чтобы открыть предоставленные по нашему запросу ссылки на источники информации в Интернет. Однако, вполне можно и не найти нужную нам информацию. Если таковое произошло, то либо нужно перефразировать свой запрос, либо в базе поисковой системе действительно нет никакой актуальной информации по нашему запросу (такое может быть при задании очень «узких» запросов, как, например «как выбрать автомобиль в Архангельске»)

Первоочередная задача любой поисковой системы – доставлять людям именно ту информацию, которую они ищут. А научить пользователей делать «правильные» запросы к системе, т.е. запросы, соответствующие принципам работы поисковых систем, невозможно. Поэтому разработчики создают такие алгоритмы и принципы работы поисковых систем, которые бы позволяли находить пользователям искомую ими информацию.

Это означает, поисковая система должна «думать» так же, как думает пользователь при поиске информации. Когда пользователь обращается с запросом к поисковой машине, он хочет найти то, что ему нужно, максимально быстро и просто. Получая результат, он оценивает работу системы, руководствуясь несколькими основными параметрами. Нашел ли он то, что искал? Если не нашел, то сколько раз ему пришлось перефразировать запрос, чтобы найти искомое? Насколько актуальную информацию он смог найти? Насколько быстро обрабатывала запрос поисковая машина? Насколько удобно были представлены результаты поиска? Был ли искомый результат первым или же сотым? Как много ненужного мусора было найдено наравне с полезной информацией? Найдется ли нужная информация, при обращении к поисковой системе, скажем, через неделю, или через месяц?

Для того, чтобы удовлетворить ответами все эти вопросы, разработчики поисковых машин постоянно совершенствуют алгоритмы и принципы поиска, добавляют новые функции и возможности, всячески пытаются ускорить работу системы.

3. Основные характеристики поисковой системы

Опишем основные характеристики поисковых систем:

  • Полнота

    Полнота - одна из основных характеристик поисковой системы, представляющая собой отношение количества найденных по запросу документов к общему числу документов в сети Интернет, удовлетворяющих данному запросу. К примеру, если в Интернете имеется 100 страниц, содержащих словосочетание «как выбрать автомобиль», а по соответствующему запросу было найдено всего 60 из них, то полнота поиска будет 0,6. Очевидно, что чем полнее поиск, тем меньше вероятность того, что пользователь не найдет нужный ему документ, при условии, что он вообще существует в Интернете.

  • Точность

    Точность - еще одна основная характеристика поисковой машины, которая определяется степенью соответствия найденных документов запросу пользователя. Например, если по запросу «как выбрать автомобиль» находится 100 документов, в 50 из них содержится словосочетание «как выбрать автомобиль», а в остальных просто наличествуют эти слова («как правильно выбрать магнитолу и установить в автомобиль»), то точность поиска считается равной 50/100 (=0,5). Чем точнее поиск, тем быстрее пользователь найдет нужные ему документы, тем меньше различного рода «мусора» среди них будет встречаться, тем реже найденные документы не будут соответствовать запросу.

  • Актуальность

    Актуальность - не менее важная составляющая поиска, которая характеризуется временем, проходящим с момента публикации документов в сети Интернет, до занесения их в индексную базу поисковой системы. Например, на следующий день после появления интересной новости, большое количество пользователей обратились к поисковым системам с соответствующими запросами. Объективно с момента публикации новостной информации на эту тему прошло меньше суток, однако основные документы уже были проиндексированы и доступны для поиска, благодаря существованию у крупных поисковых систем так называемой «быстрой базы», которая обновляется несколько раз в день.

  • Скорость поиска

    Скорость поиска тесно связана с его устойчивостью к нагрузкам. Например, по данным ООО «Рамблер Интернет Холдинг», на сегодняшний день в рабочие часы к поисковой машине Рамблер приходит около 60 запросов в секунду. Такая загруженность требует сокращения времени обработки отдельного запроса. Здесь интересы пользователя и поисковой системы совпадают: посетитель желает получить результаты как можно быстрее, а поисковая машина должна отрабатывать запрос максимально оперативно, чтобы не тормозить вычисление следующих запросов.

  • Наглядность

4. Краткая история развития поисковых систем

В начальный период развития Интернет, число его пользователей было невелико, а объем доступной информации сравнительно небольшим. В большинстве своем, доступ к сети Интернет имели лишь сотрудники научно-исследовательской сферы. В это время задача поиска информации в Интернете не была столь актуальной, как в настоящее время.

Одним из первых способов организации доступа к информационным ресурсам сети стало создание открытых каталогов сайтов, ссылки на ресурсы в которых группировались согласно тематике. Первым таким проектом стал сайт Yahoo.com, открывшийся весной 1994 года. После того, как количество сайтов в каталоге значительно увеличилось, была добавлена возможность поиска нужной информации по каталогу. В полном смысле это еще не было поисковой системой, так как поисковая область была ограничена только ресурсами, присутствующими в каталоге, а не всеми Интернет ресурсами.

Каталоги ссылок широко использовались ранее, однако практически полностью утратили свою популярность в настоящее время. Так как даже современные, огромные по своему объему каталоги, содержат информацию лишь о ничтожно малой части сети Интернет. Самый большой каталог сети DMOZ (его еще называют Open Directory Project) содержит информацию о 5 миллионах ресурсов, тогда как база поисковой системы Google состоит из более чем 8 миллиардов документов.

В 1995 году появились поисковые системы Lycos и AltaVista. Последняя долгие годы была лидером в области поиска информации в сети Интернет.

В 1997 году Сергей Брин и Ларри Пейдж создали поисковую машину Google в рамках исследовательского проекта в Стэндфордском университете. В настоящий момент Google - самая популярная поисковая система в мире!

В сентябре 1997 года была официально анонсирована поисковая система Yandex, являющаяся самой популярной в русскоязычном Интернете.

В настоящее время существуют три основные поисковые системы (международные) – Google, Yahoo и , имеющие собственные базы и алгоритмы поиска. Большинство остальных поисковых систем (коих насчитывается большое количество) использует в том или ином виде результаты трех перечисленных. Например, поиск AOL (search.aol.com) использует базу Google, а AltaVista, Lycos и AllTheWeb – базу Yahoo.

5. Состав и принципы работы поисковой системы

В России основной поисковой системой является «Яндекс», далее - Rambler.ru, Google.ru, Aport.ru, Mail.ru. Причем, на данный момент, Mail.ru использует механизм и базу поиска «Яндекса».

Практически все крупные поисковые системы имеют свою собственную структуру, отличную от других. Однако можно выделить общие для всех поисковых машин основные компоненты. Различия в структуре могут быть лишь в виде реализации механизмов взаимодействия этих компонентов.

Модуль индексирования

Модуль индексирования состоит из трех вспомогательных программ (роботов):

Spider (паук) – программа, предназначенная для скачивания веб-страниц. «Паук» обеспечивает скачивание страницы и извлекает все внутренние ссылки с этой страницы. Скачивается html-код каждой страницы. Для скачивания страниц роботы используют протоколы HTTP. Работает «паук» следующим образом. Робот на сервер передает запрос “get/path/document” и некоторые другие команды HTTP-запроса. В ответ робот получает текстовый поток, содержащий служебную информацию и непосредственно сам документ.

  • URL страницы
  • дата, когда страница была скачана
  • http-заголовок ответа сервера
  • тело страницы (html-код)

Crawler («путешествующий» паук) – программа, которая автоматически проходит по всем ссылкам, найденным на странице. Выделяет все ссылки, присутствующие на странице. Его задача - определить, куда дальше должен идти паук, основываясь на ссылках или исходя из заранее заданного списка адресов. Crawler, следуя по найденным ссылкам, осуществляет поиск новых документов, еще неизвестных поисковой системе.

Indexer (робот- индексатор) - программа, которая анализирует веб-страницы, скаченные пауками. Индексатор разбирает страницу на составные части и анализирует их, применяя собственные лексические и морфологические алгоритмы. Анализу подвергаются различные элементы страницы, такие как текст, заголовки, ссылки структурные и стилевые особенности, специальные служебные html-теги и т.д.

Таким образом, модуль индексирования позволяет обходить по ссылкам заданное множество ресурсов, скачивать встречающиеся страницы, извлекать ссылки на новые страницы из получаемых документов и производить полный анализ этих документов.

База данных

База данных, или индекс поисковой системы - это система хранения данных, информационный массив, в котором хранятся специальным образом преобразованные параметры всех скачанных и обработанных модулем индексирования документов.

Поисковый сервер

Поисковый сервер является важнейшим элементом всей системы, так как от алгоритмов, которые лежат в основе ее функционирования, напрямую зависит качество и скорость поиска.

Поисковый сервер работает следующим образом:

  • Полученный от пользователя запрос подвергается морфологическому анализу. Генерируется информационное окружение каждого документа, содержащегося в базе (которое и будет впоследствии отображено в виде , то есть соответствующей запросу текстовой информации на странице выдачи результатов поиска).
  • Полученные данные передаются в качестве входных параметров специальному модулю ранжирования. Происходит обработка данных по всем документам, в результате чего, для каждого документа рассчитывается собственный рейтинг, характеризующий релевантность запроса, введенного пользователем, и различных составляющих этого документа, хранящихся в индексе поисковой системы.
  • В зависимости от выбора пользователя этот рейтинг может быть скорректирован дополнительными условиями (например, так называемый «расширенный поиск»).
  • Далее генерируется сниппет, то есть, для каждого найденного документа из таблицы документов извлекаются заголовок, краткая аннотация, наиболее соответствующая запросу и ссылка на сам документ, причем найденные слова подсвечиваются.
  • Полученные результаты поиска передаются пользователю в виде SERP (Search Engine Result Page) – страницы выдачи поисковых результатов.

Как видно, все эти компоненты тесно связаны друг с другом и работают во взаимодействии, образовывая четкий, достаточно сложный механизм работы поисковой системы, требующий огромных затрат ресурсов.

6. Заключение

Теперь подытожим все вышесказанное.

  • Первоочередная задача любой поисковой системы – доставлять людям именно ту информацию, которую они ищут.
  • Основные характеристики поисковых систем:
    1. Полнота
    2. Точность
    3. Актуальность
    4. Скорость поиска
    5. Наглядность
  • Первой полноценной поисковой системой стал проект WebCrawler, вышедший в свет в 1994 году.
  • В состав поисковой системы входят компоненты:
    1. Модуль индексирования
    2. База данных
    3. Поисковый сервер

Надеемся, наш мастер-класс позволит Вам поближе ознакомиться с понятием ПС, лучше узнать основные функции, характеристики и принцип работы поисковых систем.

В этой статье вас ждет обзор российских поисковых систем - отечественных разработок и глобальных поисковых систем, адаптированных под рунет. Составим небольшой рейтинг из списка поисковых систем России.

История поисковых систем в мире и России

Начиналось все конечно же с сайтов и каталогов сайтов, систематизировавших информацию о них. Но сайтов становилось все больше, да и не было понятно, как быстро вывести результаты поиска по нескольким сайтам и сравнить их, чтобы получить наиболее качественный результат в ответ на вопрос. Так и назревала понемногу эта проблема с самого появления интернета.

Но предпосылка появления глобальных систем по поиску информации в интернете сложилась уже давно - по мере геометрического роста количества сайтов, появления сайтов на региональных языках отличных от английского. Более того, росло не только общее количество сайтов, увеличивалось и число страниц на каждом из них. Поэтому понадобилась автоматизированная система индексации, ранжирования.

Ну а с увеличением числа пользователей интернета по всему миру до 3 с лишним млрд - выросла востребованность и популярность поисковых систем. Надо же как-то ориентироваться в этом море информации во «всемирной паутине».

Так появился первый поисковик Альтависта, потом Яху, Гугл и другие.

Список поисковых систем в мировом интернете

В настоящее время в международном интернете существует множество поисковиков, лидером среди которых является американский Гугл.

Список мировых поисковых систем в алфавитном порядке:

  1. Baidu;
  2. Bing;
  3. DuckDuckGo;
  4. Gigablast;
  5. Google Search;
  6. Soso.com;
  7. Startpage (Ixquick);
  8. YaCy;
  9. Yahoo! Search;
  10. Yandex Search.

На фоне всеобъемлющего доминирования поисковой машины Google, адаптированной ко многим локальным языкам и встроенной по умолчанию во все андроид-смартфоны, другие игроки рынка пытаются внедрять новые фишки для пользователей или пользуются другими возможностями для своего продвижения.

Например DuckDuckGo заботится о приватности и безопасности данных своих пользователей (не следит за ними и не продает эту информацию на сторону), а Бинг от Майкрософта продвигается как встроенный поисковик в браузер EDGE операционки Windows 10.

Со времен появления первых поисковиков, многие из них уже прекратили свое существование. Другие были поглощены. Yahoo так вообще стал многопрофильной компанией, значительный доход которой принес не поиск, а инвестиции в интернет-сервисы и стартапы.

Сейчас выйти на этот рынок без значительных инвестиций в маркетинг, науку и технологии наверное невозможно. Ведь за минималистичной строкой ввода поискового запроса скрывается ресурсо- и капиталоемкий механизм, тысячи работающих сотрудников и сотни тысяч человекочасов, уже вложенных в поисковые машины в недавнем прошлом.

Да и то, - пользователи очень инертны и имеют уже сформировавшиеся поисковые предпочтения, которые сложно изменить. Пример тому - безуспешные попытки компании Microsoft занять значительную долю поиска на ПК. Во многом, такая ситуация сложилась из-за непопулярности браузеров MS среди пользователей.

Так что простым пользователям остается только выбирать для себя наилучший поисковый сервис, а также ждать еще большего укрупнения и монополизации существующих поисковиков, либо появления новых стартапов в этой области.

Основные поисковые системы в рунете

На российском рынке в течение более десятилетия сохраняется ситуация доминирования Яндекса, постепенно теряющего свою долю под сильным натиском сурового Гугла. Собственно эти два игрока и являются основными доминирующими поисковыми системами в рунете. Рейтинг построить не получится, потому что на текущий момент разделение рынка идет практически 50/50.

Обратите внимание! Продвижение под Яндекс отличается от продвижения под Google. Как продвинуть сайт в Яндексе — .

Гугл пришел в Россию в 2004 году и с тех пор процент за процентом отбирает лидерство у российской поисковой системы Яндекс, но все никак не отберет. Подобная ситуация не уникальная на мировом рынке, есть еще как минимум 2 страны, где поисковик от Google встретил серьезное сопротивление: Чехия и Китай (КНР).

Для того чтобы составить беглое представление о рынке поиска в рунете, перейдите по ссылке https://www.liveinternet.ru/stat/ru/searches.html?period=month;total=yes

После того как ПС закрыли от чужих счетчиков ключевые фразы, статистика Лайвинтернет сохранила свою ценность хотя бы оттого, что считает переходы с поиска Яндекса и Гугла. И вот что мы видим:

А на промежутке в 2 года действительно видно сокращение разрыва - Гугл догоняет и наносит ответный удар российскому поисковику.

Но как это возможно? Очень просто. Вы наверное помните, что современные фронтенд разработчики придерживаются принципа «mobile first»? И ведь неспроста - интернет действительно плавно переходит с десктопа на мобайл.

А что у нас на смартфонах и планшетах? Правильно, Андроид. А какой поиск установлен по умолчанию на Андроиде? Правильно, Гуглопоиск.

Вот такие дела. Если бы стартап «Андроид» купил Самсунг, а не Гугл - все могло бы быть по-другому.

Возвращаясь к рунету и поисковикам, нельзя не отметить постепенное снижение доли поиска от Маил.ру, плавающего около 5-6%. Его используют посетители сайтов Маил.ру Груп.

Есть еще так называемые поисковики второго эшелона: Рамблер, Нигма. Хотя корректнее их не учитывать вообще. У Рамблера (как у компании) было много проблем с менеджментом и рамблеровский поиск со временем «умер», не осилив маркетинговой конкуренции и технологической гонки. Нигма, в свою очередь, так и не взлетела - наверное потому что у российских серферов в интернете уже сформировались пользовательские привычки и предпочтения.

Таким образом, за 10-15 лет становления «поискового» рунета, Яндекс утратил звание безоговорочного и безусловного лидера и теперь уже на равных соревнуется с американским гигантом: где-то проигрывая, где-то выигрывая.

Причем тренд явно на поражение. Но посмотрим, в 2016 никто не знает на что готов Яндекс ради удержания доли поиска. Может это будет высокотехнологичная конкуренция, а может и не менее безжалостный административный ресурс - Яндекс уже прощупывает эту почву, подав недавно в суд на Гугл в ФАС и выиграв дело. Кто знает, может и Роскомнадзор заблокирует Гугл на территории РФ 😀 Конечно, ничего смешного, но я уже ни в чем не уверен.

Рынки поисковых систем в мировом интернете

Переходя от российского рынка к мировому, отмечу лишь что там ничего интересного. Практически безграничное доминирование Гугла. Есть конечно интересные ситуации на локальных рынках, о них и расскажу.

Турция. Яндекс вышел на турецкий рынок 5 лет назад и к 2016 году закрепился на отметке в 5-7%%.

Китай. Доминирует Байду, китайское правительство всячески защищает местный рынок. Да и с иероглифами западный человек без бутылки не разберется, - подобная особенность локального рынка все равно влияет на качество поиска.

СНГ. Яндекс тоже идет примерно на равных с Гуглом, где-то немного уступая, где-то немного выигрывая. Тренд на понижение более явный чем на российском рынке.

США. Американский рынок традиционно остается тем местом, где Гуглу готовы «дать по морде», используя все возможные ресурсы, другие крупные ТНК — Майкрософт, АОЛ, Яху. Это вам не неконкурентоспособная мелочь, которая не может оказать сопротивление. Неудивительно что доля гугла не является монопольной, а едва превышает 60-62% по состоянию на 2016 год.

Бинг от Майкрософта стабильно растет, а сама компания понимает важность экосистемы и находится в роли догоняющей по отношению к Андроиду. Купили Нокию и производят смартфоны с Виндоус на борту, выкатили свежую операционку для десктопов и планшетов и продвигают удобный браузер Едж. Работают люди. Яху тоже не сдается.

Вот пожалуй и все, что можно сказать о поисковых системах в России и СНГ, в мировом интернете. Самые популярные из них у всех на слуху и прочно удерживают свои места в глобальном рейтинге удобных сервисов по предоставлению поиска для интернет-пользователей.

Эта статья актуальна на 2016 год и время покажет, кто станет новым царем горы в России и мире, а кто уйдет с рынка. Пользователям ничего не остается кроме как наблюдать, голосовать рублем и ногами. То есть руками.

На первый взгляд может показаться, что быть лучше Google может только «Яндекс», да и то не факт. Эти компании вкладывают в инновации и развитие огромные суммы. Неужели хоть у кого-то есть шанс не только соперничать с лидерами, но и побеждать? Ответ Лайфхакера : «Да!» Есть несколько поисковиков, которым это удалось. Давайте посмотрим на наших героев.

Что это

Это довольно известная поисковая система с открытым исходным кодом. Серверы находятся в США. Кроме собственного робота, поисковик использует результаты других источников: Yahoo! Search BOSS, «Википедия», Wolfram|Alpha.

Чем лучше

DuckDuckGo позиционирует себя как поиск, обеспечивающий максимальную приватность и конфиденциальность. Система не собирает никаких данных о пользователе, не хранит логи (нет истории поиска), использование файлов cookie максимально ограничено.

DuckDuckGo не собирает личную информацию пользователей и не делится ею. Это наша политика конфиденциальности.
Гэбриел Вайнберг (Gabriel Weinberg), основатель DuckDuckGo

Зачем это вам

Все крупные поисковые системы стараются персонализировать поисковую выдачу на основе данных о человеке перед монитором. Этот феномен получил название «пузырь фильтров»: пользователь видит только те результаты, которые согласуются с его предпочтениями или которые система сочтёт таковыми.

DuckDuckGo формирует объективную картину, не зависящую от вашего прошлого поведения в Сети, и избавляет от тематической рекламы Google и «Яндекса», основанной на ваших запросах. При помощи DuckDuckGo легко искать информацию на иностранных языках: Google и «Яндекс» по умолчанию отдают предпочтение русскоязычным сайтам, даже если запрос введён на другом языке.

Что это

« » - российская метапоисковая система, разработанная выпускниками МГУ Виктором Лавренко и Владимиром Чернышовым. Осуществляет поиск по индексам Google, Bing, «Яндекса» и другим, а также имеет собственный поисковый алгоритм.

Чем лучше

Поиск по индексам всех крупных поисковых систем позволяет формировать релевантную выдачу. Помимо этого, «Нигма» разбивает результаты на несколько тематических групп (кластеров) и предлагает пользователю сузить поле поиска, отбросив ненужные или выделив приоритетные. Благодаря модулям «Математика» и «Химия» можно прямо в строке поиска решать математические задачи и запрашивать результаты химических реакций.

Зачем это вам

Избавляет от необходимости искать один и тот же запрос в разных поисковиках. Кластерная система позволяет легко манипулировать результатами поиска. Например, «Нигма» собирает в отдельный кластер результаты из интернет-магазинов. Если вы не намереваетесь что-то покупать, то просто исключите эту группу. Выбрав кластер «Англоязычные сайты», вы получите выдачу только на английском. Модули «Математика» и «Химия» помогут школьникам.

К сожалению, в настоящее время проект не развивается, так как разработчики перенесли свою активность на вьетнамский рынок. Тем не менее «Нигма» пока не только не устарела, но в некоторых вещах по-прежнему даёт фору Google. Будем надеяться, что разработка возобновится.

Что это

not Evil - система, осуществляющая поиск по анонимной сети Tor. Для использования нужно зайти в эту сеть, например запустив специализированный браузер с одноимённым названием. not Evil не единственный поисковик в своём роде. Есть LOOK (поиск по умолчанию в Tor-браузере, доступен из обычного интернета) или TORCH (один из самых старых поисковиков в Tor-сети) и другие. Мы остановились на not Evil из-за недвусмысленного намёка на сам Google (достаточно посмотреть на стартовую страницу).

Чем лучше

Ищет там, куда Google, «Яндексу» и другим поисковикам вход закрыт в принципе.

Зачем это вам

В сети Tor много ресурсов, которые невозможно встретить в законопослушном интернете. И по мере того как ужесточается контроль властей над содержанием Сети, их число будет расти. Tor - это своеобразная Сеть внутри Сети: со своими социалками, торрент-трекерами, СМИ, торговыми площадками, блогами, библиотеками и так далее.

YaCy

Что это

YaCy - децентрализованная поисковая система, работающая по принципу сетей P2P. Каждый компьютер, на котором установлен основной программный модуль, сканирует интернет самостоятельно, то есть является аналогом поискового робота. Полученные результаты собираются в общую базу, которую используют все участники YaCy.

Чем лучше

Здесь сложно говорить, лучше это или хуже, так как YaCy - это совершенно иной подход к организации поиска. Отсутствие единого сервера и компании-владельца делает результаты полностью независимыми от чьих-то предпочтений. Автономность каждого узла исключает цензуру. YaCy способен вести поиск в глубоком вебе и неиндексируемых сетях общего пользования.

Зачем это вам

Если вы сторонник открытого ПО и свободного интернета, не подверженного влиянию государственных органов и крупных корпораций, то YaCy это ваш выбор. Также с его помощью можно организовать поиск внутри корпоративной или другой автономной сети. И пусть пока в быту YaCy не слишком полезен, он является достойной альтернативой Google с точки зрения процесса поиска.

Pipl

Что это

Pipl - система, предназначенная для поиска информации о конкретном человеке.

Чем лучше

Авторы Pipl утверждают, что их специализированные алгоритмы ищут эффективнее, чем «обычные» поисковики. В частности, приоритетными источниками информации являются профили социальных сетей, комментарии, списки участников и различные базы данных, где публикуются сведения о людях, например базы судебных решений. Лидерство Pipl в этой области подтверждено оценками Lifehacker.com, TechCrunch и других изданий.

Зачем это вам

Если вам нужно найти информацию о человеке, проживающем в США, то Pipl будет намного эффективнее Google. Базы данных российских судов, видимо, недоступны для поисковика. Поэтому с гражданами России он справляется не так хорошо.

Что это

Ещё один специализированный поисковик. Ищет различные звуки (дом, природа, машины, люди и так далее) в открытых источниках. Сервис не поддерживает запросы на русском языке, но есть внушительный список русскоязычных тегов, по которым можно выполнить поиск.

Чем лучше

В выдаче только звуки и ничего лишнего. В настройках поиска можно выставить желаемый формат и качество звучания. Все найденные звуки доступны для скачивания. Имеется поиск звуков по образцу.

Зачем это вам

Если вам нужно быстро найти звук мушкетного выстрела, удары дятла-сосуна или крик Гомера Симпсона, то этот сервис для вас. И это я выбрал только из доступных русскоязычных запросов. На английском языке спектр ещё шире. А если серьёзно, специализированный сервис предполагает специализированную аудиторию. Но вдруг и вам пригодится?

Жизнь альтернативных поисковиков часто бывает скоротечной. О долгосрочных перспективах подобных проектов Лайфхакер спросил бывшего генерального директора украинского филиала компании «Яндекс» Сергея Петренко.

Что касается судьбы альтернативных поисковиков, то она проста: быть очень нишевыми проектами с небольшой аудиторией, следовательно без ясных коммерческих перспектив или, наоборот, с полной ясностью их отсутствия.

Если посмотреть на примеры в статье, то видно, что такие поисковики либо специализируются в узкой, но востребованной нише, которая, возможно только пока, не выросла настолько, чтобы оказаться заметной на радарах Google или «Яндекса», либо тестируют оригинальную гипотезу в ранжировании, которая пока не применима в обычном поиске.

Например, если поиск по Tor вдруг окажется востребованным, то есть результаты оттуда понадобятся хотя бы проценту аудитории Google, то, конечно, обычные поисковики начнут решать проблему, как их найти и показать пользователю. Если поведение аудитории покажет, что заметной доле пользователей в заметном количестве запросов более релевантными кажутся результаты, данные без учёта факторов, зависящих от пользователя, то «Яндекс» или Google начнут давать такие результаты.

«Быть лучше» в контексте этой статьи не означает «быть лучше во всём». Да, во многих аспектах нашим героям далеко до Google и «Яндекса» (даже до Bing далековато). Но зато каждый из этих сервисов даёт пользователю нечто такое, чего не могут предложить гиганты поисковой индустрии.