Вам понадобится
  • Персональный компьютер с подключенным интернетом.
Инструкция
1
Принципы работы поисковых систем сводятся к следующему. Многие пользователи наивно думают, что после введения вопроса поисковая система буквально начинает шерстить интернет. В действительности, все происходит совершенно по-другому.
2
Классическая поисковая система состоит из трех основных частей, а именно веб-паука, индексатора и алгоритма поиска, а также оценки результатов.
3
Веб-паук представляет собой специальную программу, запускающуюся на персональном компьютере, который подключен к интернету. Основной задачей данной программы является поиск в интернете, то есть среди его зарегистрированных страниц и во всех возможных направлениях. Станицы представляют собой гиперссылки. Таким образом, веб-паук перемещается по гиперссылкам и скачивает с них страницы для второго компонента поисковой системы, а именно индексной базы.
4
Индексатор является обработчиком страниц, которые были скачены веб-пауком. Эта программа занимается извлечением со страниц слов. Также она складывает их в уже сформированную поисковую базу, при этом записывая все ссылки, где было найдено любое слово. Такой принцип используется в поисковой системе.
5
Алгоритм поиска является главным новшеством поисковой системы. От него, в первую очередь, будет зависеть эффективность полученного при поиске результата, то есть быстрота и точность того, что пользователь может найти. Таким образом, можно сделать вывод, что когда пользователем был введен определенный запрос, ответ поисковой системой ищется именно в индексной базе, а результаты выводятся уже с помощью алгоритма поиска.
6
Для того чтобы поисковая система работала эффективно, важно, чтобы хорошо работали все три ее компонента. Причем работа каждого компонента связана со всевозможными хитрыми правилами и средствами, которые необходимо постоянно корректировать. Таким образом, чтобы поисковая система работала эффективно, она должна иметь шустрого и быстрого веб-паука, эффективный алгоритм для поиска и мощную индексную базу.
7
Релевантность является степенью соответствия полученного документа введённому вопросу. Поисковая система определяет степень соответствия, то есть, какие из выданных страниц по запросу, где встречается нужная строка, будут наиболее интересны и полезны для пользователя. Это отличает одну поисковую систему от другой и определяет е эффективность.