Baltic Digital Days 2017: Как поисковые системы оценивают и учитывают возраст документа | Статьи SEOnews

Наш SeoNews

PR-менеджер

Продолжаем обзор программной части конференции Baltic Digital Days, которая уже в пятый раз проходит в Калининграде. Одним из самых ярких и заметных докладов мероприятия стало выступление независимого эксперта Алексея Трудова, в котором он затронул тему «Как поисковые системы оценивают и учитывают возраст документа».

Алексей Трудов.jpg

Среди специалистов в области поисковой оптимизации распространено мнение, что возраст страницы — очень важный фактор ранжирования. Чем страница старше — тем лучше. Ее возраст можно определить при помощи различных операторов, параметров Яндекс.Xml и пр.

На данный момент никаких достоверных исследований по поводу влияния возраста страницы на ранжирование не существует. Все ограничивается результатами опросов экспертов, но это всего-навсего субъективное отражение личного опыта, а не реальные цифры.

Очевидно, что в ТОП-ах всегда много старых документов. Их владельцы имели возможность нарастить ссылочную массу, уделить внимание созданию качественного контента и пр.

Однако наличие в ТОП-ах множества старых документов ни о чем не говорит. Кроме возраста существует еще масса различных факторов ранжирования страниц. Очевиден своего рода парадокс — никто на самом деле не уверен в объективной важности возраста страницы, но все активно используют данный фактор.

Отражает ли modtime реальный возраст страницы

Modtime — один из технических параметров Яндекс.Xml — время последнего изменения страницы. Modtime может обнуляться. Например, документ создан в 2010 году, а его modtime датирован 2017-м. Это может происходить при выпадении страницы из индекса. Особенно важно, что, согласно распространенному мнению, modtime отражает реальные возрастные факторы, которые учитываются в ранжировании. Это легко проверить.

Если после обнуления страницы трафик упал, то modtime важен. В противном случае — нет. После анализа 5846 сайтов с 113 523 URL с детальными данными о динамике трафика за полтора года выяснилось, что обнуление modtime произошло для 4880 URL. Из этого следует, что возраст первой индексации документа определить по modtime с уверенностью нельзя.

Изменения трафика после обнуления modtime незначительны и практически равны «0».

Изменения трафика после обнуления modtime


Как посмотреть возраст страницы в Google

Существует мнение, что для определения возраста страницы необходимо задать ограничения по времени, и Google в сниппете покажет дату. Этот способ тоже не работает.

В сниппете даже может демонстрироваться дата из будущего. Как видно из примера, дата посещения страницы меньше даты, выведенной в сниппет. Дата в этом случае взята непосредственно из контента страницы. Владелец сайта может указать любую дату, так что в сниппете может оказаться что угодно.

Владелец сайта может указать любую дату, так что в сниппете может оказаться что угодно

На другом примере можно увидеть, что дата посещения страницы на полгода опережает дату регистрации домена.

Дата посещения страницы на полгода опережает дату регистрации домена

Несложно прийти к выводу, что даты, которые демонстрируют поисковые системы, не всегда показывают достоверный возраст страницы. Во всяком случае, на 100% доверять им нельзя. Они созданы для клиентов поисковых систем, а не для оптимизаторов.


Попытка определения реального возраста страницы по массе показателей

Сразу стоит отметить, что особых результатов выборка измерений большого количества показателей не принесла. Удалось определить только количество URL в Google и Яндекс и, главное, сроки, в которые их трафик вышел на плато.

Попытка определения реального возраста страницы по массе показателей


Что дало результат?

Вместо большой статистической выборки для эксперимента были рассмотрены 6 старых сайтов — заглушек, которые когда-то были созданы, но не получили дальнейшего развития. Сайты не имели ссылочного или другого трафика.

На старых URL был размещен сгенерированный текст под низкочастотные запросы. Для каждой страницы был создан практически идентичный дубль со схожей релевантностью. Главное условие — пары страниц не должны были склеиваться как дубли. Все текстовые факторы этих URL, кроме возраста, были предельно близки. В выборку не попали страницы с внешними ссылками.

Затем были созданы еще пары сайтов. В итоге получилась схема: страница на старом домене и старом URL, страница на старом домене и новом URL, пара страниц на новом домене и новом URL. Сайты на новых доменах понадобились для проверки идентичности текстовой релевантности.

В сумме получилось 954 поисковых запроса — по 6 на каждую исходную страницу.

В сумме получилось 954 поисковых запроса

Данные по индексации показали, что из всех сгенерированных страниц ни одна не была удалена Яндексом как дубль. На новых доменах некоторые страницы вылетели как некачественные. На старых доменах были проиндексированы почти все страницы.

20885020_1645961998755804_1067218868_n.png

 

Вывод: в Яндексе возраст каждого конкретного URL имеет значение.

20840317_1645962002089137_401160842_n.png

В Google ситуация выглядит иначе. Преимущество здесь получили старые страницы на старом домене. С ними почти сравнялись новые страницы на старом домене. Как и в ситуации с Яндексом, доля новых страниц на новых доменах значительно меньше. В Google на первом месте доменные факторы URL.

Выводы

Важно: все показатели — modtime, дата в сниппете Google и пр. — не демонстрируют возраст страницы в любом понимании. Надежного универсального способа оценить дату первичной индексации страницы чужого сайта не существует.

Обнуление modtime — то, чего все боятся — не показало на большой выборке значимого изменения трафика.

Тем не менее длительное нахождение URL в индексе для Яндекса действительно имеет значение. В Google такая зависимость не прослеживается. Это не значит, что его нет: зависимость может быть нелинейной.

В Google параллельно возрасту работают другие факторы ранжирования, так как в среднем трафик выходит на плато позже, чем в Яндексе.

«Вылет» страницы в Вебмастере, как недостаточно качественной, не всегда связан с характеристиками документа. BAD_QUALITY в Вебмастере связан в том числе с показателями всего сайта.

В понимании Яндекса недостаточно качественная страница — это необязательно страница с «копипастом» и прочими «смертными грехами». Яндекс определяет как некачественные те страницы, у которых мало шансов оказаться в выдаче по каким-то запросам.


На заметку специалистам

По изменению modtime нет смысла оценивать эффективность «склейки». Modtime можно использовать для получения дополнительной информации при оценке конкурентов, но эти данные будут сильно «зашумлены» и не факт, что они будут способствовать пониманию ситуации.

На старте любого проекта стоит сделать «заглушку» для накопления возрастных факторов. При продвижении под Яндекс не будет лишним также сразу создать URL для особо важных документов.

Для новых проектов небезопасно применять вылетевшие домены. Необходимо учитывать риски и использовать дропнутые домены в случаях, когда ссылочная масса может перевесить их все.

В качестве условных ориентиров для продвижения на Google можно принять 16 месяцев, под Яндекс — один год. Эти временные рамки полезны для оценки сроков возврата инвестиций.

Проблемы с BAD_QUALITY в Вебмастере можно попытаться решить при помощи продвижения успешных разделов. Это даст трафик уже в ближайшем будущем, а заодно улучшит доменные факторы. Они повлияют на увеличение процента страниц в индексе.

.