УЧАСТОК № 2031
Суббота, 2017-08-19, 9:24 AM

Американские ученые предположили...
Астрономы выяснили как черные дыры уничтожают звез...
Двухлетняя девочка из Лондона бьет рекорды по IQ
"Радиосвязь" тринадцатого века

Меню сайта
Новинки кинематографа 2015 года. Что нас ждёт в мире кино 2015 года.
Категории раздела
Спорт [270]
Загадочное [18]
Компьютеры [81]
музыка и видео [86]
Катастрофы [43]
наука [57]
Приколы [77]
новости [153]
Здоровье [254]
Космос [16]
Авто [33]
Техника [11]
Происшествия [33]
Политика [150]
Интересное [173]
Культура [15]
Способы заработка [8]
Оказывается... [51]
Всякое-разное [166]
Самое-самое [9]
Для дома, для дачи [15]
Мини-чат
СайтоФренды
Главная » 2013 » Июнь » 19 » Как проходит индексация сайтов
Как проходит индексация сайтов
4:59 PM

Начало индексации ресурса обуславливается приходом на сайт поискового робота (краулера, спайдера) - это индексирующая программа, которая обходит все задействованные ресурсы в сети и для обработки отправляет их содержимое индексаторам. Изредка отдельно выделяют кроулеров - помимо поиска, этот робот может сам анализировать, по какой ссылке документа ему идти дальше.

Естественно, для анализа передаются не все данные. Часто содержание сайта очищается от ненужных тегов. Затем производится обработка полученной информации, определение частоты, веса, и плотности ключевых слов. Обработанные данные попадают в базу данных поисковой системы (индекс).

Работа поисковых роботов порой может привести к отрицательным последствиям. К примеру, если в индексе окажутся документы, которые показывать владелец сайта не хочет, или страницы, которые владелец посчитал малоинформативными. Во избежание таких проблем существует протокол Robot Exclusion Protocol, позволяющий запрещать индексацию всего сайта или отдельных его частей. На практике команды обозначаются в файле robots.txt , который размещают в корневом каталоге сайта. Вы можете найти этот файл, он должен находиться по адресу "домен вашего сайта"/robots.txt. В ином случае поисковые роботы не смогут найти его и проиндексировать весь сайт.

Управление индексацией сайта

Индексацией поисковых систем можно управлять с помощью файла robots.txt. В этом файле можно запретить или разрешить для индексации те или иные части сайта.

Существует специальный тег <NOINDEX></NOINDEX>, который позволяет защитить от индексации отдельные части страницы. Благодаря этому можно повысить плотность индексирующихся ключевых слов на странице. Все, что содержится в теге, не индексируется поисковыми роботами систем Яндекс и Рамблер. Однако, использование ‹noindex› не желательно, поскольку некоторые поисковые системы его не воспринимают.

Например, Google применяет атрибут rel="nofollow".
Если у вас сайт небольшого размера (10-20 страниц) файл robots.txt можно создать вручную с помощью специальных программ с визуальным редактором (например, Page Promoter). Если сайт большой, то во избежание ошибок рекомендуется пользоваться программными ресурсами для автоматизации процесса.

Необходимое время для индексации сайта обычно составляет от двух дней до двух недель, зависимо от того, какая поисковая система (самая быстрая индексация сайта происходит в системе Google). Поэтому, нужно отметить, если ваша ссылка на странице другого сайта не была проиндексирована на протяжении трех недель, значит, она скорее всего закрыта для индексации.


Индексация сайта – лишь только малый этап всего процесса поискового продвижения сайта. Однако, если сайта нету в индексе поисковых систем, то он точно не попадет в топ выдачи. Поэтому, такой момент, как индексация, весьма важен для грамотного продвижения сайта.
Категория: Всякое-разное | Просмотров: 1424 | Добавил: Plsatel | Рейтинг: 0.0/0 |
Всего комментариев: 0
Добавлять комментарии могут только зарегистрированные пользователи.
[ Регистрация | Вход ]
Поиск
КУРСЫ ВАЛЮТ
Официальный
УКРАИНА      РОССИЯ
Курсы валют Курсы валют Курсы валют Курсы валют
Наличный КИЕВ
Курсы валют
Курсы валют
Календарь
«  Июнь 2013  »
ПнВтСрЧтПтСбВс
     12
3456789
10111213141516
17181920212223
24252627282930
Архив записей
Статистика

Онлайн всего: 1
Гостей: 1
Пользователей: 0



Copyright MyCorp © 2017