Технологии для поиска



Для получения списка сайтов нужно ввести поисковый запрос, состоящий из слов. Слово как отдельная лексическая единица и является основой для формирования выдачи.


Задача поискового робота обойти как можно больше страниц в интернете и запомнить их содержание, разбивая весь текст на слова, чтобы создать привязку страницы к определенной тематике. Затем учитывается, встречаются ли все слова из запроса в тексте страницы и сколько раз их можно найти. На основе этих данных и формируется выдача. Это общий принцип работы поисковиков актуальный и для 2000 годов, и для нашего времени.

Что влияет на результаты поиска



Но все же факторов для формирования списка сайтов гораздо больше. Сегодня считается, что на порядок сайтов в общем списке влияет не только текст, но и то, как другие посетители вели себя на нем, т.е время, которое они провели, на каких местах сайтах остановились и т.д.

Свое влияние оказывают и ссылки, поставленные на страницы с других источников, количество полезной информации, возраст сайта, частота обновления.

Конечно, все принципы работы неизвестны, чтобы не было искусственного манипулирования списками сайтов. Это и позволяет людям получать нужную информацию, избегая спама и нежелательных страниц с вирусами.

Поисковик сегодня невероятно сложная система, с большой командой разработчиков для каждого сервиса. Ведь, например, на Яндексе можно смотреть и видео, и искать картинки, и читать новости. Все эти сервисы работают по своим принципам, также как и поиск по ним.

В каждой поисковой системе есть отделы аналитики, задача которых выяснить все ли устраивает пользователей. Работы над совершенствованием алгоритмов ведутся каждый день. Для поддержания работы таких систем требуются тысячи серверов, расположенных по всему миру, для обеспечения стабильно высокой скорости доступа к ресурсам.