Как убрать дубли страниц в WordPress?

Есть магазин на Woocommerce. В панель вебмастеров Google регулярно приходят уведомления о том, что найдены дублирующиеся title и description. Смотрим, что там за дубли — скриншот: Выходит, что один и тот же товар доступен по правильному URL (тот, что длиннее) и по URL, который не включает главную категорию (в данном случае /ventilyatory/). И такие дубли обнаруживаются постоянно. Перенаправления проставлены, но проблема остается. Как предупредить такое дублирование? WordPress 4.1, тема Virtue, Woocommerce 2.4.7
Отслеживать
68.1k 223 223 золотых знака 79 79 серебряных знаков 222 222 бронзовых знака
задан 6 янв 2016 в 14:56
Алексей Лещенко Алексей Лещенко
95 2 2 серебряных знака 10 10 бронзовых знаков
Как удалить дублирующие ссылки ведущие в одну и туже категорию

Подскажи, где находится исходники генерирующие эти дублирующие ссылки, буду весьма благодарен. На других блогах такой картины не замечал, там всегда срабатывает ошибка 404. Да и как добавить rel=»canonical» в категории «Вордпресс» без плагинов?
7.8 лет назад 30
Дело в том, что последних два варианта постоянных ссылок имели место быть, но это было ранее, затем я заменил структуру URL
Каким образом? Неграмотно заменили значит. В ЧПУ остались правила перезаписи для:
/category/komplektuyushhie/videokarty
/kompyuternaya-texnika/komplektuyushhie/videokarty
/category/kompyuternaya-texnika/komplektuyushhie/videokarty Вообще вот эти игры с удалением category , выставление в настройках ЧПУ %catygory% , а затем удаление вложенных рубрик из URL — все это ненормальные вещи и там много мелочей, которые нужно учитывать. Поэтому для этого рекомендую использовать плагины и не простые а хорошие, если они есть конечно.
Подскажи, где находится исходники генерирующие эти дублирующие ссылки
Все это в правилах перезаписи находится там в виде регулярок, разобраться будет не просто. Смотри global $wp_rewrite; В качестве костыля, можно сделать надстройку на хук template_redirect и там проверять регуляркой URL, если неподходящий, то отдавать 404 страницу или ставить 301 редирект на правильный URL
BigDimoz 7.8 лет назад
Тимур, хуки точать для меня сложно пока, пытаюсь учиться. Может если для тебя не сложный код, выложи готовый, буду благодарен, дальше копать глобал начну. А пока нашел код для простановки rel=»canonical» в категории и метки, теперь в «запоротых» ссылках проставляется нормальный, требуемый (текущий) URL, может поисковики, постепенно выкинут «левак», по аналогии с комментариями плодящих дубли, но сильно уповать не стоит, тут случай же другой.
Nick757 5.3 года назад
Аналогичная проблема:
Имеем рубрики
example.com/first
example.com/second Добавляем любые символы перед рубрикой example.com/ehrfads/first — итог отдает содержимое рубрики example.com/first Как это побороть?
Как избавиться от дублей страниц WordPress
Очень часто владельцы wordpress сайтов начинают беспокоиться, если не понимают из-за чего отдельные страницы проваливаются в выдаче. Причиной тому могут быть дубли страниц. Это страницы, содержащие материалы с идентичным или похожим контентом. Речь о страницах архивов дат, рубрик, авторов и комментариев. При этом они могут располагаться под разными адресами, что позволяет дублям конкурировать с основной статьей за место в поисковой выдаче. В этом материале мы расскажем как избавиться от дублей страниц.
Создание дублей страниц на сайте
Как мы уже рассказывали ранее, дубли одной конкретной страницы, где размещена одна конкретная статья создаются и в архивах дат, и в рубриках или категориях (могут называться по-разному), а также на страницах с комментариями. Благодаря этому пользователи могут сортировать посты и находить по определенным критериям нужные. Система делает это автоматически.
Давайте посмотрим как это выглядит на примере архива дат. Предположим нам нужно выбрать все статьи за ноябрь. На главной странице сайта кликните на ссылку в виджете с указанием месяца.

Кликнув на ссылку «ноябрь 2018» перед вами появится список из статей, которые были сделаны за указанный месяц. Вот наглядный пример того, что под архивы дат wordpress создает отдельную страницу. Вспоминаем про индексацию лишних страниц поисковиком и об ее негативных для продвижения последствиях. Подробнее мы рассказывали в статье о том, как удалить страницы вложений в wordpress.

Дубли в комментариях
При работе с комментариями вебмастерам следует учитывать, что как таковые, дубли страниц создаются при наличии древовидной системы обсуждения. В том числе если обсуждений очень много и комментариям не хватает места на одной странице, то часть их перемещается на следующие. И в этом случае вам необходимо удалить дубли страниц в wordpress, иначе проиндексированные страницы станут своеобразной ловушкой для пользователей. Они просто попадут на страницу комментариев статьи, а не на саму статью, после чего посетители, скорее всего покинут сайт. SEO-продвижение явно пострадает от большого количества отказов.
Как удалить дубли с помощью плагина WordPress
Чтобы не разбираться с провалами в поисковой выдаче, лучше заранее провести профилактическую работу. А именно удалить дубли страниц в wordpress. Мы предлагаем вам воспользоваться плагином оптимизации сайтов Clearfy. В его арсенале большой спектр полезных функций для удаления дублей страниц. Скачайте данное приложение и установите, так мы сможем рассказать о всех фичах более предметно.
После активации перейдите в меню настроек плагина: «Настройки» => «Clearfy меню» =>

=> далее раздел «SEO» (в левом боковом меню плагина) => вкладка «Дубли страниц»

Начнем по порядку, с удаления архивов дат. Здесь стоит сразу уточнить, что удалять дубли в буквальном смысле мы не будем. Их просто отключат от индексирования. И это важнее, чем избавиться фактически от копий страниц. Если дубликаты не видит поисковик, значит пользователь перейдет на основную, нужную вам для продвижения страницу и не заблудится в многообразии ссылок-клонов. Чтобы запустить функцию нажмите кнопку ВКЛ.

С архивом автора, ситуация такая же, как и с архивом дат: дубли не удаляются, а отключаются от индексации. Также ставится редирект с дубля на основную страницу. Активируйте и эту функцию.

Чтобы удалить метки архивов, нужно поставить редирект со страниц тегов на главную. Для этого активируйте функцию ниже. Аналогично предыдущим. Обратите внимание на серую метку со знаком вопроса. Она указывает на то, что негативных последствий настройка не вызовет.

Для каждой фотографии или видео wordpress создает отдельную «страницу вложений» с возможностью комментирования, что является своеобразным якорем оптимизации. Подробней об этом мы говорили в предыдущей статье. Нажимаем кнопку ВКЛ.
![]()
Если у вас на сайте пагинация настроена таким образом, что контент размещается сразу на нескольких страницах, то в конце URL, в том или ином виде, будет добавляться порядковый номер каждой страницы. Clearfy же, предложит вам удалить постраничную навигацию записей. То есть каждая страница одной статьи будет редиректиться на основную. Нажмите кнопку ВКЛ.
![]()
Если у вас настроены древовидные комментарии, то их иерархия создаст благоприятные условия для создания копий страниц. Выглядит это так: вы отвечаете на чей-то комментарий и одновременно в URL появляется переменная ?replytocom – это значит, что поисковик видит в этом не ответ на комментарий, а отдельную страницу, так как адрсе отличается. Удалить дубли страниц в wordpress и выполнить редирект вы можете активировав данную функцию.

Заключение
Время и силы, затраченные на продвижение сайта или отдельных статей могут уйти впустую. Если не позаботиться об удалении дублей страниц заранее. Они индексируются поисковиком и могут составить конкуренцию основным статьям. После прочтения данной статьи мы надеемся, что вы оценили весь спектр представленных функций и теперь вам будет несложно удалить дубли страниц в wordpress.
Как удалить дубли страниц
После того как были обнаружены копии страничек веб-ресурса, нужно решить, как убрать дублирование. Ведь даже если подобных повторений немного, это все равно негативно скажется на рейтингах Вашего веб-ресурса – поисковики могут наказать Вас снижением позиций. Поэтому важно убрать дубликаты страниц независимо от их количества.
Получить бесплатную консультацию от SEO-эксперта по вашему сайту
С чего начать удаление дублей страниц
Для начала рекомендуется выявить причину, по которой появилось дублирование контента. Чаще всего это:
- Ошибки при формировании структуры веб-ресурса.
- «Проделки» некоторых современных движков для сайтов, которые при неправильных настройках довольно часто автоматически генерируют копии и хранят их под разными адресами.
- Неправильные настройки фильтров поиска по сайту.
Способы решения выявленных проблем
После выяснения причины, по которой появилось дублирование, и ее устранения нужно принять решение касательно того, как убрать дубли страниц. В большинстве случаев подойдет один из этих методов:
- Удалить дубли страниц вручную. Этот метод подойдет для небольших веб-ресурсов, содержащих до 100–150 страничек, которые вполне можно перебрать самому.
- Настроить robots.txt. Подойдет, чтобы скрыть дубликаты страниц, индексирование которых еще не проводилось. Использование директивы Disallow запрещает ботам заходить на ненужные страницы. Чтобы указать боту Яндекса на то, что ему не следует индексировать странички, содержащие в URL «stranitsa», нужно в robots.txt добавить:



В результате при попытке зайти по адресу страницы-дубля Вы увидите:



Если нет возможности убрать дубли страниц.
. или же Вы не хотите их удалять, можно хотя бы обезопасить странички, которые при помощи внутренней перелинковки связаны с ними. Для этого используется атрибут rel=«nofollow». Если прописать его в ссылках, они больше не будут передавать вес.

Теперь Вы знаете достаточно способов того, как убрать дубли страниц. Если умело их комбинировать, Вы сможете добиться, чтобы не осталось ни единого прецедента дублирования контента. Только после этого можно рассчитывать на максимальную эффективность продвижения Вашего сайта.
Если остались вопросы по данной теме, не забудьте их задать в комментариях!