Битые ссылки - найти и обезвредить

Битая ("мёртвая") ссылка - это ссылка, которая ведет на несуществующую страницу сайта, изображение и т.д. Как правило, при переходе по такой ссылке, выскакивает ошибка 404 - документ не найден. Напомню, что ссылки могут быть внутренними (перелинковка внутри одного сайта) и исходящие (ведущими на другие сайты). Необходимо избавляться как от внутренних, так и от исходящих битых ссылок. Они могут появляться по следующим причинам:

  • Страница была удалена;
  • В комментариях был указан адрес сайта, который теперь не существует;
  • Были изменены ЧПУ и при этом не сделаны 301-е редиректы на документы с новыми URL;
  • В статью было добавлено видео с YouTube, которое позднее было удалено;
  • Была установлена ссылка на скачивание программы с официального сайта, но после обновления программы, разработчики поменяли и адрес файла с программой;
  • Некорректная работа некоторых плагинов. К примеру, на моём блоге, битые ссылки вида https://mukhutdinov.com/comment-subscriptions?srp=998&srk=&sra=s создавались плагином Subscribe to Comments Reloaded.

Рассмотрим два варианта поиска битых ссылок: универсальный (подойдет для любого сайта) и для сайтов на CMS WordPress.

Xenu - программа для поиска битых ссылок

Xenu's Link Sleuth - небольшая бесплатная программа, которую можно загрузить с сайта автора (ZIP-архив 426 Кб).

После установки запускаем программу и щелкаем по иконке Check URL (File-Check URL).

Нажимаем Check URL в интерфейсе программы Xenu
Нажимаем Check URL

По умолчанию, включена опция Check external links (проверять исходящие ссылки). Её нужно отключать в том случае, если вы хотите проверить только внутреннюю перелинковку сайта.

Вставляем адрес сайта, который хотим проверить и жмём ОК
Вставляем адрес сайта, который хотим проверить и жмём ОК

После окончания парсинга, имеет смысл отсортировать результаты по колонке Status, для этого достаточно щелкнуть по заголовку этой колонки.

Результаты проверки отсортированы по колонке Status
Результаты проверки отсортированы по колонке Status

Как показала проверка, на моём блоге приличное количество битых ссылок, как внутренних, так и исходящих (обведены в списке красной рамкой). К примеру, была определена как битая, ссылка на некогда существовавший ЦОП Яндекса "Profit partener" (подсвечена синим). На данный момент, сайт не работает, в чем можно было убедиться сделав двойник клик по ссылке в списке.

Все строки кликабельны. По двойному клику на любой из строк, осуществляется попытка загрузить страницу, размещенную по указному URL.

Итак, битые ссылки найдены, но пока непонятно, с каких страниц сайта они ведут. Для того, чтобы в этом разобраться, щёлкаем правой клавишей мыши на любой строке из списка и в контекстном меню выбираем команду URL properties (свойства URL).

Для того, чтобы узнать URL страницы, на которой размещена битая ссылка, в контекстном меню выбираем URL properties
Для того, чтобы узнать URL страницы, на которой размещена битая ссылка, в контекстном меню выбираем "URL properties"

На скриншоте ниже видно, что обнаружено три страницы, на которых проставлены ссылка на Profit partener. Обратите внимание, что вторая и третья ссылки - это дубли, которое создал WordPress при добавлении комментариев.

Программа обнаружила три страницы с битой ссылкой на Profit partener
Программа обнаружила три страницы с битой ссылкой на Profit partener

Остается удалить ссылку со станицы, размещенной по первому (каноническому) URL - на дублях ссылки будут сняты автоматически.

Необходимо настроить WordPress таким образом, чтобы он не плодил дублей с допиской ?replytocom. Для поиска дублей в Xenu, следует отсортировать список по колонке Title - повторяющие тайтлы говорят о наличии дублей.

Плагин для WordPress

Если ваш сайт или блог работает на движке WordPress, то можно воспользоваться плагинами, которые предназначены для поиска битых ссылок. Одним из самых популярных плагинов является Broken Link Checker. При необходимости изменить настройки, выберите в консоли команду Настройки - Проверка ссылок. Как правило, я не изменяю настройки плагина. Если на вашем сайте много неактивных ссылок (текст ссылки присутствует, но по щелчку ничего не происходит), то имеет смысл отслеживать "битость" и таких ссылок. Чтобы это было возможно, на вкладке Which Links To Check, ставим галочку на против пункта Plaintext URLs (Текстовые URL-адреса).

Broken-Link-Checker-6
В настройках Link types (типы ссылок) поставьте галочку около пункта Plaintext URLs

По мере сканирования сайта, Broken Link Checke, будет сообщать результаты. Чтобы увидеть найденные ошибки, выполняем команду Инструменты - Неправильные ссылки.

Для просмотра результатов сканирования, выполняем команду Инструменты - Неправильные ссылки
Для просмотра результатов сканирования, выполняем команду "Инструменты - Неправильные ссылки"

В отчете, в разделе "Неправильные" , битые исходящие и внутренние ссылки, помечены разными значками.

Плагин Broken Link Checker: Битые исходящие ссылки помечаются жёлтыми значками, битые внутренние ссылки - красными
Битые исходящие ссылки помечаются жёлтыми значками, битые внутренние ссылки - красными (кликабельно)

Нет необходимости гадать, на какой странице находится битая ссылка, так как источник уже указан в таблице (колонка "Источник"). Смело можно удалять ссылки типа http://none, http://одноклассники, http://нет сайта. Как правило, подобные ссылки, оставляют компьютерные чайники - у них нет сайта, но они, оставляя комментарии, пытаются заполнить поле "Сайт", которое не является обязательным для заполнения.

В сайтах некоторых тематик, рассчитанных на чайников, следует скрывать поле "Сайт" в форме комментариев, дабы не усложнять жизнь пользователям и себе.

Чтобы удалить ссылку, можно навести на неё курсор и в появившемся меню выбрать команду Удалить ссылку.

Если вы уверены, что ссылку можно безболезненно удалить, щелкните "Удалить ссылку"
Если вы уверены, что ссылку можно безболезненно удалить, щелкните "Удалить ссылку"

Обратите внимание, что данная ссылка была добавлена с комментарием. Ссылка была удалена, но комментарий остался, т.е. ничего ценного не удалилось.

В некоторых случаях, особенно если речь идет о внутренних ссылках, необходимо не удалять ссылку, а отредактировать её. Для этого выбираем команду Редактировать URL. Если есть сомнения по поводу того, что делать с ссылок, то следует навести курсор на ссылку в колонке "Источник" и выбрать команду Перейти.

Если есть сомнения, то лучше просмотреть страницу, на которой размещена битая ссылка
Если есть сомнения, то лучше просмотреть страницу, на которой размещена битая ссылка

Посмотрев, где именно размещена ссылка, можно принять окончательное решение - удалить или изменить ссылку.

Большим плюсом плагина Broken Link Checke, в сравнении с Xenu,  является то, что он в состоянии обнаружить видео YouTube на вашем сайте, которое не работает.

На строительном сайте, Broken Link Checker обнаружил 6 роликов YouTube, которые не воспроизводятся
На строительном сайте, Broken Link Checker обнаружил 6 роликов YouTube, которые не воспроизводятся

Как правило, видео перестает отображаться по той причине, что она удалено с YouTube.

Видео не производится на сайте, так как она было удалено с YouTube
Видео не производится на сайте, так как она было удалено с YouTube

В конкретном случае, необходимо заменить код неработающих роликов, так от этого зависят поведенческие факторы.

Выводы

Если ваш блог или сайт работает на WordPress, то рекомендую установить плагин Broken Link Checker и устранять найденные им ошибки.

Для того, чтобы подстраховаться (по моим наблюдениям, плагин находит не все битые ссылки), следует проводить дополнительную проверку при помощи программы Xenu's Link Sleuth.

Оставьте первый комментарий

Оставить комментарий

Ваш электронный адрес не будет опубликован.


*