Добрый день, читатели блога BiznesSystem.ru. Сегодняшняя тема — проверка битых ссылок на сайте. Когда я только знакомился с интернетом, мне казалось, что каждый сайт и каждая страница вечны и будут существовать в сети всегда. Даже мысли не возникало, что веб ресурсы и их содержимое исчезают столь же часто, как и появляются. В результате их пропажи в сети остается масса нерабочих (битых) ссылок. Ранее, перейдя по таким линкам мы попадали на страницу с нужным контентом, а, теперь, натыкаемся на ошибку 404 или на сообщение, что сервер недоступен.

проверка битых ссылок на сайте

Содержание:

Нерабочие ссылки принято называть битыми — оба эти названия верны. Стоит отметить, что не каждый URL пропавшей страницы попадает в категорию битых ссылок – битыми считаются только те, которые оставили в интернете следы своего прошлого существования.

Допустим, был сайт, никто на него не ссылался и, если он пропал, в сети не осталось никакого следа — битых ссылок в результате его пропажи не появилось. Другое дело, когда полезный контент мотивировал других вебмастеров ставить на него ссылки и потом исчез. Страницы нет, а упоминания о ней остаются в сети — это уже проблема.

Битые ссылки – это ссылки (с тегами a href) на несуществующие URL адреса (их никогда не было или они перестали существовать).

Вред от битых ссылок

Отталкиваться стоит от того, что наличие нерабочих ссылок, как минимум бесполезно. Когда вы ссылаетесь на другую страницу и рекомендуете ее посетителям своего сайта, то посетитель должен найти там что-то полезное. Если он наталкивается на ошибку, то пользы не получает. «Обломался» так человек один раз, потом второй и его желание переходить по вашим рекомендациям существенно снизится.

Негативный эффект оказывает наличие битых ссылок и на поисковое продвижение. Среди множества факторов, оказывающих влияние на ранжирование веб сайтов в поиске, значатся и те, что оценивают ошибки – битая ссылка – это ошибка. Чем их суммарно больше, тем ниже траст вашего сайта в глазах поисковых систем.

Если говорить о внутренних переходах, отправляя пользователя на несуществующую страницу собственного сайта, вы недополучаете просмотры страниц и время пребывания на сайте, чем ухудшаете поведенческие факторы.

Отдельная тема – это реферальные (партнерские ссылки). При их некорректности вы теряете реальные живые деньги.

Избавляться от этого недуга нужно обязательно. Единственная проблема – если сайт большой, то вручную найти каждую отдельную ссылку непросто – процесс надо автоматизировать, благо, способов имеется немало. 4 варианты проверки сайта на битые ссылки я покажу в статье ниже.

Причины появления ошибок

Причинами появления битых ссылок могут стать разные факторы, зависящие как от владельца площадки, на которой ссылка размещена, так и от владельца ресурса, на который несуществующий адрес ведет – нередко, это одно и то же лицо (в случае с внутренними ссылками).

Наиболее частые причины появления битых ссылок:

  1. Ошибка при создании ссылки – в процессе создания ссылки, вебмастер мог ошибиться и неверно указать адрес ссылки (достаточно одного неправильного символа). В результате, такая ссылка будет вести на изначально несуществующую страницу.
  2. Изменение структуры сайта – в этом случае могут меняться адреса страниц и, если вебмастер не настроил переадресацию со старых адресов на новые с помощью 301 редиректа, переходы по старым линкам приведут к ошибке.
  3. Удаление страниц – часть контента, появляющегося в интернете, является временным и, в какой-то момент) теряет свою актуальность . Настает момент, когда такие страницы больше не нужны и их просто удаляют, в результате, их адреса выдают 404 ошибку, а ссылки на них становятся битыми.
  4. Закрытие сайта – случается, что сайт закрывается полностью. Может быть, перестала существовать фирма, для которой он работал, может он поймал АГС фильтр от Яндекса и владелец посчитал, что выводить из под санкций не рентабельно. Причина не важна – как только домен перестали продлевать, сайт работать перестает и, соответственно не работают все его внутренние страницы – каждая ссылка, ведущая на них, становится битой.

Что делать с битыми ссылками

Прежде чем рассказать о том, как проверить сайт на битые ссылки, я хочу рассказать о том, что с ними делать после обнаружения. Иначе, какой смысл их искать, если не известно, что делать впоследствии.

Для начала необходимо разделять нерабочие линки на внешние с вашего сайта на чужой, внешние с чужого сайта на свой и внутренние.

С внутренними никаких проблем быть не должно – вы просто берете и меняете некорректный адрес на правильный, в результате, битая ссылка превращается в нормальную рабочую.

Аналогично поступаем и с теми ссылками, которые ведут с вашего ресурса на недействующие страницы чужого – исправляем или удаляем.

Остается вариант, когда посторонний сайт ссылается на несуществующие страницы вашего домена. Напрямую поправить ошибку вы не можете. Есть вариант – обратиться к владельцу сайта донора (на котором стоит ссылка) и попросить его сменить адрес. Если это сделать не получается, то самостоятельно настройте перенаправление с неправильного адреса на правильный, лучше всего, с помощью постоянного редиректа (301) в файле htaccess.

При использовании постоянного редиректа вы не потеряете не только посетителей, переходящих на сайт, но и влияние внешних ссылок, так как поисковики интернета правильно понимают систему перенаправлений.

Программы проверки битых ссылок

Самый качественный (по моему опыту) анализ сайтов делается с помощью программы Xenu’s Link Sleuth. Простой пример – только с ее помощью мне удалось найти нерабочие видео ролики на сайте. Все остальные способы находили недействующие ссылки в традиционном их понимании (формата <a href>), а Xenu сканирует все встречающиеся URL адреса на страницах, даже если они не форматированы как ссылки.

Скачать программу можно здесь – скачать Xenu’s Link Sleuth

Сейчас покажу, как ей пользоваться. После запуска установленной проги будет открываться пустое окно, в котором нажимаем на пиктограмму страницы (подписанную как Check URL).

Xenu - программа првоерки битых ссылок

Там вписываете адрес своего сайта и жмете ОК.

url проверки

Программа отсканирует полностью все существующие на указанном домене страницы – выставит их статус, тип, title страницы (если существует), уровень вложенности и другие характеристики. Тут можно не только битые ссылки отслеживать.

результаты xenu

Нормальные адреса подсвечены зеленым, битые – красным цветом. Можно просто пролистать список в поисках битых, но это долго, лучше сразу сделать выборку. Сверху вкладка View, в ней ставим галочку Show broken links only. В списке останутся только нерабочие красные линки.

фильтр битых ссылок в xenu

Следующий шаг – найти место, где каждая нерабочая ссылка находится (на какой странице). Для этого правой кнопкой мыши щелкаем по порядку и в контекстном меню выбираем URL properties.

свойства ссылки xenu

Там указана страница (-цы) где есть эта ссылка.

url properties xenu

Открываете нужную страничку, проверяете и исправляете. Иногда программа дает ложные срабатывания – это значит, что она при проверке не смогла «достучаться» до адреса – это мог быть временный сбой сервера, поэтому совету все важные ссылки проверять вручную перед удалением.

Проверка битых ссылок онлайн сервисами

Достоинство онлайн сервисов всегда заключается в том, что не нужно ничего устанавливать себе на компьютер. Любой софт – это лишний мусор в памяти машины (особенно, если он вам требуется всего один раз), а также риск подхватить какие-нибудь вирусы при скачивании с неофициальных сайтов (тут у меня статья про бесплатные антивирусники — обязательно поставьте себе). А тут — зашли на сайт, сделали проверку, получили результат, и ничего не надо ставить.

Но имеются и общие недостатки онлайн сервисов – как правило, ограничено количество бесплатно сканируемых страниц.

Онлайн сервисов для проверки битых ссылок существует масса. Раньше я пользовался вот этим – brokenlinkcheck.com, но он на английском и не всем будет комфортен. Ограничение 3000 страниц, остальное за деньги.

Не так давно мне попался русскоязычный сервис, который понравился больше — brokenlinklookup.com — дизайн по приятнее и интерфейс проще. Но тут ограничения более жесткие – бесплатно всего 1000 страниц (небольшим проектам достаточно, а для крупных порталов, все же, придется использовать программы). Вот краткая инструкция по brokenlinklookup.com

Главная страница содержит форму для адреса проверяемого сайта:

проверка битых ссылок онлайн - brokenlinklookup

Результаты поиска выглядят списком недействующих ссылок, справа отображается тип ошибки (404, 403 и т.д.).

результаты проверки

Для того, чтобы посмотреть подробности по каждой ссылке, надо нажать на тип ошибки справа. Во всплывающем окне появляется информация.

подробно по ссылке

Все данные можно отправить себе на электронную почту или скачать файл – поле для почты и ссылка на скачивание находятся под списком.

Плагин для WordPress Broken Link Checker

Плагин довольно распространенный. В репозитории WordPress, среди других плагинов, он имеется и устанавливается через панель администратора сайта, если что, инструкция по установке плагинов здесь.

Broken Link Checker в режиме реального времени сканирует страницы веб ресурса, если находит битые ссылки, то добавляет их в список, указывая, количество проверок, периоды, типы ошибок.

Достоинства:

  • Контролирует ссылки постоянно (периодически делая обход);
  • Проверяет ссылки многократно и указывает сколько раз ссылка была нерабочей и в течении какого периода времени, что исключает случайные ложные срабатывания;
  • Позволяет прямо из админки исправить или удалить все копии битой ссылки в один клик;
  • Можно настроить уведомление по e-mail;
  • Проверяет ссылки в черновиках и на закрытых страницах.

Недостатки:

  • Работает только со страницами движка, если у вас есть отдельные страницы, например, лендинги, то плагин их не заметит;
  • Находит не все косяки, несмотря на то, что в настройках стоит проверка видео роликов, у меня он не находит в них нерабочих ссылок, иногда, пропускает и обычные ссылки.

В целом, я его работой доволен, процентов на 95% со своими функциями справляется, главное что в режиме реального времени.

После установки и активации в админке сайта, в разделе «Инструменты» появится закладка – «Неправильные ссылки» с указанием числа битых ссылок, найденных плагином.

broken link checker

Также, появится виджет «Broken Link Checker» с информацией по работе плагина.

виджет неправильных ссылок

А в разделе «Настройка» будет вкладка «Проверка ссылок», через которую вы сможете выставить конфигурацию плагина отличную от базовой, хотя там и по умолчанию все в порядке.

Итак, плагин работает и нашел у вас проблемы – высветится в виджете в админке и во вкладке инструменты. Нажав на ссылку с указанием числа неверных ссылок, вы перейдете к их списку.

неправильные ссылки

Подводя курсор к каждому элементу, вы увидите, как появляются варианты действий:

  • Редактировать URL – меняете адрес на любой другой;
  • Удалить ссылку – анкорный текст перестанет быть ссылкой, сам текст сохранится;
  • Not Broken – сообщаете плагину, что ссылка рабочая и он ошибся, элемент из списка пропадает;
  • Dismiss – отключает проверку данной ссылки в будущем;
  • Recheck – перепроверить ссылку заново;

Под кодом ошибки есть ссылка на детализацию по проверкам – Details – там можно посмотреть подробности. Например, я не удаляю ссылки, которые были ошибочными один раз и, без раздумий удаляю те, которые являются битыми в течение нескольких месяцев и проверялись десятки раз.

детальный отчет

Плагин, однозначно, полезный, и для более менее крупных проектов незаменим.

Нерабочие ссылки в Yandex Webmaster

Многие знакомы с инструментами для вебмастеров от Яндекс. Если вы ими еще не пользуетесь, то рекомендую туда добавить свои сайты, так как более подробной информации по техническому состоянию веб ресурсов не найти.

Ссылка на регистрацию — webmaster.yandex.ru

В отличие от описанных выше методов, с помощью Яндекса мы можем отследить  битые ссылки не со своего сайта, а на свой (ссылаются чужие домены или ведут внутренние линки).

Открываете сервис, выбираете нужный сайт, после чего в левом меню раскрываете категорию «Индексирование сайта», а в ней открываете «Исключенные страницы» — там нас интересует раздел с 404 ошибками.

yandex webmaster ошибка 404

В нем содержатся адреса, на которые есть ссылки, а самих страничек не существует.

Переадресация через файл htaccess решит сию проблему и, постепенно, по мере обхода поискового робота ошибки уйдут, а вес ссылок перетечет на новую страницу.

Нерабочие ссылки в Google Webmasters

Аналогичным образом ведет учет ошибок и Google. Инструменты для вебмастеров этой поисковой системы располагаются по адресу — www.google.com/webmasters/tools/home?hl=ru

Для выбранного сайта в левом меню ищем раздел «Сканирование» — «Ошибки сканирования», в нем и будут все 404 ошибки, найденные этой поисковой системой у вас на сайте.

google webmaster ошибки 404

Подробная информация по неправильным ссылкам открывается кликом мыши по соответствующей строке, там даты проверки и все входящие линки (внешние и внутренние).

информация по неправильной ссылке google

Внутренние битые ссылки поправьте сами, а для внешних все тот же 301 редирект вам в помощь.

На этом все, теперь вы сможете убрать один из факторов, оказывающих негативное влияние на ваш ресурс и сделать его более привлекательным для пользователей интернета.