Да, текст комментариев так же индексируется, как и текст ответов. Более того, индексируются теги, ники авторов и даже текст, оформленный в цитату, если он находится в дополнении к вопросу. В качестве текста не индексируется только цитата в ответе.
Вимана написала, видимо о браузерах, а не о поисковиках.
По поводу поисковиков:
В России бесспорный лидер Яндекс, далее Google и Mail
В мире Yandex далеко не в лидерах, как написал(а) angren, он даже не входит в десятку, сами подумайте, что такое население и пользователи интернета в России, по сравнению с тем же Китаем или Америкой.
Так что мировой расклад примерно такой:
Google
Yahoo
MSN
Далее идут более мелкие:
Aol
Ask
NetScape
Myway
а вообще поисковых систем в мире очень и очень много.
Ну, это в принципе несложно. И подобным средством пользуются не только поисковики, но и другие достаточно продвинутые сайты наподобие интернет-магазинов и т.п.
А ларчик то открывается легко. Для этого используются маленькие файлики, которые распространяет сам проект-виновник. В эти файлики (именуемые "куками" - cookies) и записываются ваши предпочтения в части запросов и выбора. И вот когда вы делаете свой запрос, информация из этих файликов передается на главный сайт проекта, где и обрабатывается соответствующим образом. Ну в смысле, чтобы в следующий раз подсунуть вам что-то из того, что вас однажды заинтересовало.
Вежливые проекты обычно спрашивают вас типа согласны ли вы на хранение у себя "куков", а другие делают это молча...
В принципе "куки" вещь неплохая, но вот только частенько "благими намерениями выстлана дорога а ад".
Думаю, что я правильно понял вопрос. Попробую дать ответ.
Поисковые машины - это вычислительный комплекс, который оперирует цифрами. Поэтому, для правильной расстановки сайтов по рейтингу используются какие-то цифровые значения.
В поисковике "Яндекс" есть так называемый тИЦ - тематический индекс цитирования. Чем выше значение тИЦ - тем выше популярность ресурса. Как говорит сам Яндекс, тИЦ рассчитывается по специальному алгоритму и используется для определения в рубриках каталога поисковой машины Яндекса. тИЦ в Яндексе определяется (вычисляется) для всего сайта целиком.
Подробнее об этом можно почитать на самом Яндексе.
А узнать тИЦ можно на различного рода ресурсах, например, тут или найти сайт в каталоге Яндекса и посмотреть. Вот скриншот
Красным подчеркнуто значение тИЦ.
В поисковике google.com иная система. У этой поисковой системы существует понятие PageRank или сокращенно PR (не путать с PR - Public Relations, это несколько другая опера) - алгоритм сортировки популярности страниц. Таким образом PR может быть разным для различных страниц сайта (в отличие от Яндекса). Думается мне, что алгоритм расчета PR держится в секрете. Но некоторые подробности расчета можно почитать тут. Там же указываются ссылки на ресурсы, где можно узнать значение PR для конкретного сайта.
Об алгоритмах остальных поисковых системах я не знаю. Поэтому говорить о них не буду.
Есть специальная программа, которая постоянно знакомится с информацией и индексирует её. Когда пользователь пишет свой запрос в поисковой строке, автомат начинает поиск по уже созданным индексам. Информация в интернете обновляется без конца. Обновление обгоняет работу поискового автомата. Поэтому некоторые документы в определённый период времени могут быть не найдены, изменены или удалены. Размещение ссылок на информацию идёт в соответствии с запросом. Критерий последовательности размещения называется релевантностью. У каждой поисковой системы свой метод определения релевантности. Иначе, релевантность - это то, в какой степени документ соответствует запросу. Значение имеют не только вводимые в поисковую строку слова, но и в каком порядке они располагаются, удалённость их друг от друга в тексте, частота упоминания.