Как найти и убрать дубли страниц сайта

 

Как найти и убрать дубли страниц сайта


У тех вебмастеров, кто занимается оптимизацией сайта, на пути встает проблема:  Как найти и убрать дубли страниц сайта. Если вовремя не заняться искоренением дублей страниц сайта, то их количество будет расти в геометрической прогрессии. Что в свою очередь будет отрицательно отражаться на поведенческих факторах сайта.

После долгой, упорной, кропотливой и нудной борьбы с дублями страниц сайта пришел к очевидному, бытовому выводу: Нужно бороться не со следствием возникновения дублей, а устранять причину их возникновения.

 Так как движок CMS Joomla изначально не приспособлен для SEO, то большая ручная работа убрать дубли страниц сайта возлагается на вебмастера.   

Все дубли страниц, которые появились в результате сканирования сайта поисковыми роботами, являются следствием незнания и не корректной работы вебмастера.

На каждой странице сайта довольно много ссылок, которые получаются при создании самой страницы плюс ссылки  шаблона сайта (плагинов, модулей и других расширений). И почти каждая ссылка на отдельной странице может породить дубль, а то и N –ое количество дублей.

 Все страницы: действующие, дубли страниц на сайте  или дубли какой-либо функции расширения загружаются, накапливаются и хранятся в КЭШе поисковых систем. По истечении определенного времени, производится анализ по всем существующим дублям. И поисковики опускают страницы в ТОП выдаче.

И прежде, чем приступать к проблеме  как убрать дубли страниц сайта, необходимо проанализировать выдачу страниц в поиске Яндекса и Google. В первую очередь конечно используя инструменты Панели вебмастера Яндекса и Google. И на основании полученных  данных приступать к избавлению сайт-дубли. 

Некоторые ссылки можно запретить в файле robots, а некоторые ссылки удалить навсегда.

Вот наиболее вероятностные источники дублей на сайте:

Форма входа
component/users/?view=reset
component/users/?view=remind
component/users/?view=registration
Форму входа можно удалить или откорректировать в файле robots.

 Модуль Коментарии

Ссылка категории материала
Ссылка категории  настраивается при создании материала.

Ссылка категории пункта меню
тип меню материал
тип меню список категории
 тип меню блок категории
Ссылка категории  настраивается при создании пункта меню.

В результате грамотной работы по созданию сайта, можно исключить все негативные последствия. И тем самым обеспечить спокойную работу по продвижению и оптимизации сайта.

Источниками дублей страниц сайта может быть заголовок h1 и title !!!

Почему? Ответ:  Оказывается, я сам писал об этом в начале данной статьи.

Большое внимание уделял проблеме: как убрать дубли страниц сайта (устранению явных дублей).
А выяснил, что еще существуют скрытые, неявные дубли, о которых мало информации в прессе.

Это я обнаружил в процессе работы по SEO оптимизации сайта. Провел  SEO аудит сайта на бесплатном сервисе Мегаиндекс и был ужасно удивлен, увидев результаты анализа сайта.

О сервисе Магаиндекс смотрите на странице: Сервис Мегаиндекс

Если при создании материала и пункта меню оставить не заполненные поля:
Мета-тег Description
Мета-тег Keywords
Title tag
они автоматически заполнятся аналогичными данными из Главного пункта меню.

К примеру Если создать 10 страниц с  незаполненными полями, то получится 10 страниц с одинаковыми ключевыми словами, описанием, заголовком H1.

А это, некоторые поисковые боты, посчитают за дубли страниц сайта.

 

По данной теме читайте следующие статьи:

Что такое redirect-301
Файл robots.txt для Joomla 2.5
robots.txt. Удаление дублей в Joomla 2.5
robots.txt Ошибки и рекомендации
robots.txt Как устранить дубли для сайта Joomla 2.5
Дубли страниц Joomla 2.5
Плагин для удаления дублей Shnodoubles