Перехват URL-адресов

Хороший рейтинг в поисковых системах имеет первостепенное значение для успеха веб-проекта. Перемещение вашего сайта на верхнюю строчку страницы результатов по поисковым запросам увеличивает вероятность того, что веб-пользователи найдут дорогу на ваш сайт. Не случайно поисковая оптимизация уже много лет является одной из самых важных дисциплин в веб-разработке. Она включает в себя как поиск и включение подходящих ключевых слов, так и адаптацию структуры вашего сайта для инструментов оценки поисковых систем. Дополнительной целью является повышение собственной ссылочной популярности за счет использования обратных ссылок — то есть ссылок, указывающих на ваш веб-проект, — созданных на внешних сайтах.

Если система SEO используется правильно, то можно ожидать увеличения количества посетителей. Если, несмотря на максимальную поисковую оптимизацию, вы не отмечаете никакого роста или даже теряете долгосрочный трафик, это может означать, что ваши SEO-меры реализуются неэффективно. Но существует также вероятность того, что так называемый «захват URL» удалил ваши страницы из индекса соответствующей поисковой системы и скрыл их от потенциальных посетителей.

Определение URL hijacking

Перехват URL — это процесс, при котором URL ошибочно удаляется из индекса поисковой системы и заменяется другим URL. Новый, ложный URL по-прежнему ссылается на реальную целевую страницу, но не напрямую, а через перенаправление. Поскольку неверный URL также перенимает рейтинг оригинального сайта, захват URL может привести к значительному снижению числа посетителей.

Что такое перехват URL?

Концепция захвата URL описывает явление, при котором сайт исчезает из результатов поисковой системы и заменяется другим. Этот другой сайт ссылается на реальную целевую страницу или URL, но не напрямую, а через перенаправление. Например, linked-site.com указывает на your-site.com, но вместо обычного HTML-тега <a> используется перенаправление. Перенаправленный URL выглядит примерно так, как показано в следующем примере:

www.linked-site.com/redirect.php?target=www.your-site.com

Когда поисковая машина находит такую ссылку, она классифицирует связанный сайт и целевой сайт как идентичные, что означает, что она удаляет один из них из индекса. Она ориентируется на коды статуса HTTP, которые приклеиваются к редиректу. Если код 301 (Moved Permanently) означает постоянное перенаправление с заданного URL, то код 302 (Found) — временное перенаправление на указанный URL. Первый тип не вызывает проблем, но 302-редирект является основной причиной перехвата URL. Такие хорошо составленные перенаправления внушают краулеру поисковой системы, что целевой сайт существует лишь временно и что связанная страница на самом деле является оригинальной — и краулер никогда не проверяет, действительно ли стороны связаны или нет. Если проверки не происходит, то индексируется неправильная страница, которая вытесняет рейтинг связанного URL.

Где используются 301 и 302 редиректы?

Существует множество причин для использования перенаправления URL. В результате постоянное перенаправление так называемых доменов с опечатками на правильный домен является широко распространенной практикой. Например, если вы случайно наберете в адресной строке браузера googel.com вместо google.com, вы все равно попадете на стартовый сайт популярной поисковой машины. Постоянная переадресация на правильный адрес главной страницы также не редкость. Например, если вы заходите на главную страницу англоязычной версии Википедии, набрав en.wikipedia.org, вы автоматически переходите по 301-переадресации на URL en.wikipedia.org/wiki/Main_Page. Разработчики также используют постоянную переадресацию, чтобы направлять посетителей на новый веб-адрес после смены домена или для идентификации содержимого веб-проекта, получившего новый URL.

Временные перенаправления 302, с другой стороны, в основном используются для временного представления контента с другого URL, чтобы он оставался доступным, например, во время обслуживания исходной страницы. Если разработчик вручную создает этот тип перенаправления, то подразумевается, что содержимое снова появится на исходном URL позже. Но есть два сценария временных перенаправлений или тех, которые приводят к взлому URL, предназначенных исключительно для этой цели:

  1. Непреднамеренное использование перенаправления 302: Вполне возможно, что разработчики ссылаются на чужой веб-проект с помощью временного перенаправления, не имея при этом дурных намерений. Это может быть ошибкой, когда намерением было установить постоянное перенаправление. Механизм перезаписи URL веб-сервера Apache, mod_rewrite, устанавливает перенаправления по умолчанию с кодом состояния 302.
  2. Динамически генерируемые URL-адреса: PHP — это широко используемый язык сценариев для веб-разработки. Серверные скрипты на этом языке программирования являются простым и практичным способом создания динамического контента для вашего сайта. Но часто это также PHP-скрипты, которые динамически встраивают целевые адреса в существующий URL, используя временный код состояния пересылки 302. Такие типы скриптов в основном используются в каталогах веб-адресов, а также во многих системах управления контентом.
  3. Сознательно внедренный перехват URL-адресов: Преступники также знают, как использовать перехват URL, и с удовольствием пользуются этим. Они сознательно используют 302 редиректы для продвижения собственного контента в индексе и для «похищения» особенно хорошо ранжированных страниц. Эта тактика не является ни устойчивой, ни законной и подпадает под термин «черная шляпа SEO».

Как защитить свой веб-проект от перехвата URL-адресов

Все, кто занимается повышением рейтинга своих сайтов, знают, насколько это сложный и трудоемкий процесс. Чем выше вы поднимаетесь в рейтинге поисковой машины, тем больше вероятность перехвата проиндексированных страниц. В отличие от атак, которые становятся возможными благодаря дырам в защите веб-проекта, процесс перехвата URL тесно связан с основной SEO дисциплиной построения ссылок, поэтому его невозможно предотвратить только с помощью защитного программного обеспечения. Поэтому невероятно важно регулярно анализировать как новые, так и существующие обратные ссылки, чтобы отсеять проблемные URL. Существует ряд инструментов и сервисов, таких как SEMrush, LinkResearchTools, SISTRIX или Google Search Console, которые могут помочь в этом.

Упомянутый сервис Google предоставляет инструмент для удаления URL-адресов, который позволяет удалить из поискового индекса все нежелательные перенаправления, ссылающиеся на ваш сайт. Однако перед этим всегда следует связаться с разработчиком и попросить скорректировать маршрутизацию — так есть шанс, что соответствующие обратные ссылки будут сохранены. Код состояния 307 (временное перенаправление) со времен HTTP 1.1 предлагает возможность временной переадресации, которая не приводит к перехвату URL.

Если исходный сайт уже исчез из индекса, вам следует связаться с поставщиком поисковых систем и попросить восстановить исходное ранжирование после того, как вы переделаете или удалите поврежденную обратную ссылку.

Оцените статью
cdelat.ru
Добавить комментарий