Коллеги, посоветуйте



Коллеги, посоветуйте.
Есть сайт, на нем около ~3 000 000 страниц, но периодически контент на этих страниц становится не актуальными (содержимое индексировать не стоит - мусор) и мы возвращаем 404 ошибку, чтобы удалить из индекса. А затем по прошествии времени контент может изменится и нужно вернуть страницу в индекс.
Вопрос - как лучше это сделать? Оставить как есть: 404 ошибка, затем 200 (через месяц-два, или никогда), или страницу закрывать от индексации мета-тегом (а затем открывать если контент изменился)?
632   18  

Comments

  1. Лёня Вергун
    Лёня Вергун 4 года назад
    Лучше отдавайте 302 код на главную, а ещё лучше просто указывать meta noindex пока контент не актуален и убирать из карты сайта
    • Алекс Кучеров
      Алекс Кучеров 4 года назад
      Лёня Вергун то есть вы сообщаете "контент временно переехал на главную" так?
    • Лёня Вергун
      Лёня Вергун 4 года назад
      Алекс Кучеров ну да, в таких случаях он до месяца или двух не будет склеивать страницу как 301, но это более плохой вариант чем noindex
    • Алекс Кучеров
      Алекс Кучеров 4 года назад
      Лёня Вергун почему не нарушать правила и не указать как есть - 404. Исключить из sitemap? и отстегнуть от основного контента убиранием ссылок . Второй вариант еще лучше: не менять код ответа - указать на самой странице что информация актуальна на такое то такое то и сейчас неактуальна и отстегнуть от основного контента - повисит как orphan Page - а потом когда надо вернуть
    • Алекс Кучеров
      Алекс Кучеров 4 года назад
      кстати по второму варианту сделано почти у всех агрегаторов электроники - когда товар уже неактуален. По прямой ссылке на него можно попасть - а по самому сайту переходами нет. Я так всегда делаю с карточками товаров - более того в микроразметке Product - меняю Price valid until и дата снятия с публикации, и еще в микрухе меняю InStock на OutOfStock, а на самой странице пишу нет в наличии. Но страница есть до тех пор пока не будет выкинута из индекса.
    • Лёня Вергун
      Лёня Вергун 4 года назад
      Алекс Кучеров Убрать ссылки в большинстве случаях довольно затруднительно, а большое число 404 негативно сказывается на общей индексации сайта.
    • Алекс Кучеров
      Алекс Кучеров 4 года назад
      Лёня Вергун думаю вы путаете - большое количество 404 страниц на которые есть внутренние ссылки - и это проблема "грязи" и низкого качества и ситуации когда вы "правильно" отдали то как есть на самом деле - то есть отстегнули страницы и убрали их из sitemap/
    • Лёня Вергун
      Лёня Вергун 4 года назад
      Алекс Кучеров насколько я понимаю тут и есть ситуация, когда такие страницы уже сгенерированы движком сайта
    • Алекс Кучеров
      Алекс Кучеров 4 года назад
      Лёня Вергун скорее всего отстегнуть не проблема - это какие то сквозняки - вряд ли проставлено по тексту ))) ну и потом - периодически нало прогонять на 301 и 404 и исправлять
  2. Олексій Оксимець
    Олексій Оксимець 4 года назад
    Якщо сторінка довгий час не змінюється віддавайте код 304. Вже потім як ласт мод змінитися на актуальний - переводьте автоматом в 200. Навіщо в цій схемі 404, мені не зрозуміло...
    • Олексій Оксимець
      Олексій Оксимець 4 года назад
      Поясню, з 304 ви зачасту будете пропадати в "соплі видачі", і получається сторінка наче в індексі, наче не спамить не актуальну інфу, і в той же час повністю зберігає свою статичну вагу. Так як в інших випадках (302, 404, 301) ви її обнулите.
  3. Виктория Огородник
    Виктория Огородник 4 года назад
    Мне кажется, эти игры с выпадением из индекса не очень хорошо отражаются на продвижении сайта. Почему бы просто не добавить вверху или внизу страницы информацию для пользователей о том, что статья актуальна на такой-то момент. С датой. И обновлять её при обновлении контента.
    • Максим Кульгин
      Максим Кульгин 4 года назад
      Виктория Огородник да. и это самое верное
    • Филипп Гынкота
      Филипп Гынкота 4 года назад
      Виктория Огородник я бы ещё добавил разметку https://ruschema.org/Article с мета тегом expires с датой когда статья уже не актуальна и dateModified когда в последний раз редактировалась (соответственно после редактирования двигать снова expires).
  4. Evgeniy Orlov
    Evgeniy Orlov 4 года назад
    На страницы, которые нужно убирать и возвращать, есть внутренние линки из контента? Или только из навигации и футера?
    • Максим Кульгин
      Максим Кульгин 4 года назад
      Evgeniy Orlov есть
  5. Sergio Smorovoz
    Sergio Smorovoz 4 года назад
    Меняем контент, меняем урл, ставим 200 и скармливаем ботам через футер.
  6. Ivan Kleshchev
    Ivan Kleshchev 4 года назад
    А зачем такие изыски вообще? Имеются результаты тестирования по каким-то параметрам в выдаче других страниц или сайта в целом? Совсем удалили - отдаете 410, чтобы бот туда больше не шлялся и крулинг не тратил. В остальных случаях достаточно в заголовке и сайтмэпе отдавать дату изменения (как уже выше рекомендовали). Бот и не будет ее индексировать, пока не будет изменена дата на свежую.