Что индексирует поисковая система


Что индексирует поисковая система?
Домены
Для специалистов, которые занимаются раскруткой сайта в Интернете необходимо очень четко понимать, зону индексирования поисковых машин, для того, чтобы знать, какие сайты можно в них встретить, а какие - нет, какие сайты возможно добавить в каталог поисковика, а какие не будут индексироваться. Яндекс и Рамблер – это поисковые системы русскоязычного Интернета – Рунета, однако они индексируют не только сайты с доменной зоной .ru, но и также и с другими зонами - .info, .com и другие, только они непременно должны быть на русском языке. Сайты из этих доменных зон попадают в зону индексирования Яндекса и Рамблера через ссылки с других сайтов, которые уже известны этим поисковикам. Google считается мировой поисковой системой, поэтому он индексирует сайты из абсолютно любых доменных зон.
Документы, которые индексируют поисковики
Первоначально поисковые машины были направлены на индексирование исключительно интернет-страницы, то есть тексты, выложенные на сайт в формате HTML, которые отображаются интернет-сервером по HTTP-протоколу. Спустя некоторое время разработчики поисковых систем обнаружили, что много полезной и востребованной информации находятся в Интернете в виде документации руководств, статей, прейскурантов, представленных при помощи программ из «Microsoft Office». В связи с этим практически все поисковые машины стали индексировать выложенные в интернете документы в различных форматах - Word, MS Excel, PDF. Огромную популярность приобрели динамические страницы в формате Flash, что, несомненно, привело к тому, что поисковики начали индексировать и тексты, которые скрыты в этом формате.
Несмотря на расширенные возможности поисковых машин, не следует делать акцент на подобных форматах текстов, потому что нет гарантии, что поисковики проиндексируют их как следует. Если есть такая возможность, стоит всегда сохранять дубли вашей информации в традиционном для Интернета формате HTML.
Предположим, у вас есть прейскурант в формате MS Excel, но поисковая машина может и не добраться до него. А если все-таки доберется, то индексирование пройдет на очень низком качественном уровне, потому что поисковики еще не способны разбирать структурирование файлов в формате Excel, тогда как в HTML-страницы индексируются качественно и на высшем уровне. В связи с этим рекомендуется иметь прейскурант и в обычном формате веб-страницы.
Также не следует забывать, что поисковики не индексируют те тексты, которые показываются на экране пользователя при помощи динамически разными программными способами, например, языка JavaScript. Поисковик не видит и не индексирует их также, как и тексты в графическом формате.