Включение RSS-каналов на вашем сайте

Многие операторы веб-сайтов используют RSS для расширения своих онлайн-предложений за счет контента от профессиональных провайдеров. Но как насчет технологии подачи? Мы рассмотрим этот вопрос в контексте синдикации контента и дадим вам обзор функций и возможностей использования RSS.

Что такое RSS-канал?

RSS — это технология веб-канала, которая позволяет онлайн-провайдерам публиковать новый контент на своем сайте в стандартизированной форме. Веб-каналы можно найти на новостных порталах, блогах, форумах или вики — по сути, на любых динамичных веб-предложениях, которые часто подвергаются постоянному обновлению. Цель заключается в том, чтобы постоянно информировать пользователей Интернета о новом контенте, как в случае с новостной лентой. Поток информации начинается как тянущая среда от получателя, который подписывается на интересующие его веб-каналы. Используется программное обеспечение для чтения фидов (обычно это приложение или веб-приложение). Пользователи подписываются на каналы, чтобы автоматически получать контент и актуальные новости от провайдеров. URL-адреса этих каналов можно получить из веб-браузера.

RSS-каналы можно использовать для методов синдикации контента или для многократного использования контента. RSS-контент сайта, после того как он структурирован, может быть легко интегрирован в другие страницы. Операторы онлайн-платформ иногда используют эту возможность, чтобы дополнить собственную страницу иностранным контентом, придать своей домашней странице характер портала или зарекомендовать себя в качестве агрегатора новостей.

Однако использование иностранного веб-контента для синдикации контента сопряжено с рисками, связанными с авторским правом. Кроме того, синдицированный контент часто является дубликатом, что может привести к потере рейтинга в поисковых системах.

Как работает RSS-канал?

RSS был разработан в 1999 году компанией Netscape Communications. В то время это была аббревиатура от RDF Site Summary, технологии, используемой как часть индивидуальных сообщений, которые можно было отправлять в сети My Netscape. Год спустя Resource Description Framework (RDF) был заменен на более простой формат XML, в результате чего аббревиатура RSS (Rich Site Summary) стала означать Really Simple Syndication. Преемником RSS является формат Atom, который основан на RSS.

В настоящее время RSS представляет собой набор форматов файлов XML, с помощью которых структурированные веб-каналы предлагаются под специально разработанными URL-адресами. Различные каналы RSS часто подразделяются тематически. Например, New York Times предоставляет отдельные каналы для различных тем новостей, таких как бизнес, искусство или недвижимость.

Общим для всех форматов файлов RSS является то, что они представляют собой чистые элементы контента. Технология использует расширяемый язык разметки (XML) для семантической маркировки информации. Информация о представлении контента не включается в документы RSS. Это позволяет комбинировать веб-каналы на основе RSS с широким спектром технологий и представлять контент через Интернет на всех типах носителей. Однако перед представлением RSS-документы должны быть сначала преобразованы в HTML. Парсеры RSS, содержащиеся в программах для чтения каналов, способны интерпретировать разметку XML и обрабатывать информацию как HTML-документ.

Представление RSS-каналов

Отображение веб-каналов может осуществляться с помощью специальных программ для чтения каналов. Подробный список программ, подходящих для операционных систем Windows, Mac и Linux, можно найти на сайте rss-readers.org. Однако сегодня большинство веб-браузеров имеют встроенный парсер RSS, поэтому все меньше и меньше пользователей Интернета нуждаются в отдельном программном обеспечении для чтения. Кроме того, RSS-каналы поддерживаются программами почтовых клиентов, такими как Microsoft Outlook или Mozilla Thunderbird.

Представление контента зависит от того, какую информацию предоставляет поставщик контента, и зависит от средства представления. Обычно это короткие информационные блоки в стиле новостной ленты, содержащие, помимо заголовка статьи, текстовую аннотацию со ссылкой на источник и частично дополненные изображениями.

На следующих скриншотах показано представление RSS-каналов газеты «Нью-Йорк Таймс» в Mozilla Firefox, Microsoft Internet Explorer и Opera.

В Mozilla Firefox RSS-каналы отображаются в виде динамических закладок. Представленная информация ограничивается заголовком статьи и включенным в нее тизером. Один щелчок на записи с гиперссылкой переводит вас на сайт-источник, содержащий соответствующую статью в полном виде.

В Microsoft Internet Explorer (IE) управление RSS-каналами осуществляется через панель проводника. Записи содержат заголовки, изображения статей, короткий тизерный текст, а также дату публикации статьи, на которую ссылаются. Под заголовком отображается гиперссылка на сайт-источник.

Если вы пользуетесь Opera, у вас есть возможность сохранить ленту новостей как часть функции персонализированных сообщений. В отличие от Firefox и IE, Opera предоставляет пользователям предварительно выбранные источники.

В отличие от Firefox, IE и Opera, Chrome не поддерживает RSS-каналы Google Chrome. Вместо того чтобы разбирать XML-документ, лежащий в основе URL RSS, и переводить его в HTML-страницу, Chrome предоставляет исходный код ленты в необработанном виде — хороший пример синтаксиса языка разметки XML.

Если вы хотите управлять RSS-каналами с помощью Chrome, браузер должен быть дополнен дополнительными расширениями. Бесплатные дополнения можно найти в Интернет-магазине Chrome.

Структура RSS-документа

RSS-документы имеют очень удобную структуру. Основными элементами являются XML-теги <rss>, <channel> и <item>.

Тег Функция
rss Элемент rss является элементом верхнего уровня RSS-канала. Он определяет используемую версию RSS и должен содержаться в каждом документе RSS.
канал Элемент channel описывает канал RSS и содержит соответствующие метаданные.
элемент Элемент item служит маркером для блоков статей.

Каждый XML документ начинается с тега, который объявляет соответствующую версию XML, а также используемый набор символов — в данном примере XML 1.0 и UTF-8.

<? xml version='1.0' encoding='UTF-8'?>

После начального объявления XML идет тег rss. Он указывает на соответствующую версию RSS и, в данном примере, содержит ссылки на дополнительные спецификации, которые могут быть включены в виде пространств имен XML. В следующем примере семантическими символами являются Dublin Core (dc) и Atom (atom).

<rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0">

Фактическое содержание документа RSS вложено в тег канала. Он содержит общее описание ленты новостей (заголовок, описание), включенные метаданные (язык, авторское право, docs, генератор, managingEditor, webMaster), логотипы и ссылки. 

<channel>
<title>NYT > Home Page</title>
<link>
http://www.nytimes.com/pages/index.html?partner=rss&emc=rss
</link>
<atom:link rel="self" type="application/rss+xml" href="http://www.nytimes.com/services/xml/rss/nyt/HomePage.xml"/>
<description/>
<language>en-us</language>
<copyright>Copyright 2017 The New York Times Company</copyright>
<lastBuildDate>Mon, 27 Mar 2017 08:19:34 GMT</lastBuildDate>
<image>
<title>NYT > Home Page</title>
<url>
https://static01.nyt.com/images/misc/NYT_logo_rss_250x40.png
</url>  
<link>
http://www.nytimes.com/pages/index.html?partner=rss&emc=rss
</link>
</image>
[…]
</channel>

Дочерние элементы, используемые с тегом channel, делятся на обязательные и необязательные.

Обязательные элементы Функция
title Элемент title содержит заголовок RSS-канала.
ссылка Элемент link содержит ссылку на веб-сайт.
описание Элемент description содержит описание RSS-канала.
Необязательные теги Функция
язык Элемент language задает язык RSS-канала.
copyright Элемент copyright содержит информацию об авторских правах на канал.
атом:ссылка Элемент link, унаследованный от спецификации atom, позволяет определить связь со связанным элементом. По умолчанию используется значение rel=»alternate», которое является альтернативным представлением текущего ресурса. В данном случае: URL самой ленты новостей.
docs Элемент docs содержит URL для документации по используемому формату RSS.
generator Элемент generator содержит строку, указывающую, с помощью какой программы был создан канал.
managingEditor Элемент managingEditor содержит адрес электронной почты человека, который отвечает за содержание канала.
webMaster Элемент webMaster содержит адрес электронной почты человека, который отвечает за технические проблемы, связанные с каналом. В данном примере он не указан.

Тег channel также содержит отдельные блоки элементов, которые служат для отображения предварительного просмотра статей. Каждый блок элемента представляет статью и, в данном примере, содержит теги <title>, <link>, <description>, <category>, <dc:creator>, <pubDate> и <guid>.

<item>
<title>
Dealt a Defeat, Republicans Set Their Sights on Major Tax Cuts
</title>
<link>

</link>
<guid isPermaLink="true">

</guid>
<atom:link rel="standout" href="http://www.nytimes.com/2017/03/26/us/politics/trump-republicans-tax-cuts.html?partner=rss&emc=rss"/>
<media:content url="https://static01.nyt.com/images/2017/03/27/us/27TAXES-sub/27TAXES-sub-moth.jpg" medium="image" height="151" width="151"/>
<media:description>
Under new pressure, some Republican deficit hawks appear ready to abandon the fiscal rectitude that they embraced during the Obama administration to help salvage President Trump’s agenda.
</media:description>
<media:credit>Doug Mills/The New York Times</media:credit>
<description>
Congressional Republicans face a challenge made more difficult by the collapse of their health care bill, and may have to scale back their grand plans.
</description>
<dc:creator>ALAN RAPPEPORT</dc:creator>
<pubDate>Mon, 27 Mar 2017 01:04:59 GMT</pubDate>
<category domain="http://www.nytimes.com/namespaces/keywords/des">Federal Taxes (US)</category>
<category domain="http://www.nytimes.com/namespaces/keywords/des">United States Politics and Government</category>
<category domain="http://www.nytimes.com/namespaces/keywords/des">Law and Legislation</category>
<category domain="http://www.nytimes.com/namespaces/keywords/des">Corporate Taxes</category>
<category domain="http://www.nytimes.com/namespaces/keywords/mdes">Federal Budget (US)</category>
<category domain="http://www.nytimes.com/namespaces/keywords/nyt_org_all">House Committee on Ways and Means</category>
<category domain="http://www.nytimes.com/namespaces/keywords/nyt_org_all">House Freedom Caucus</category>
<category domain="http://www.nytimes.com/namespaces/keywords/nyt_org_all">Treasury Department</category>
<category domain="http://www.nytimes.com/namespaces/keywords/nyt_per">Ryan, Paul D Jr</category>
<category domain="http://www.nytimes.com/namespaces/keywords/nyt_per">Trump, Donald J</category>
</item>

Кроме тега category, каждый дочерний элемент может быть использован только один раз для каждого элемента.

Тег Функция
title Элемент title содержит заголовок статьи.
ссылка Элемент link содержит ссылку на статью.
описание Элемент description содержит текстовую заметку или тизер.
категория Элемент category помещает статью в категорию. Он может использоваться как единственный элемент в теге item.
dc:creator Элемент dc:creator указывает на лицо или организацию, ответственную за создание документов.
pubDate Элемент pubDate указывает момент времени, когда была опубликована соответствующая статья.
guid Элемент guid содержит глобальный уникальный идентификатор, с помощью которого можно однозначно идентифицировать запись. Как правило, программа чтения каналов использует этот идентификатор для различения новых и ранее прочитанных элементов.

Подписка на RSS-каналы

Операторы веб-сайтов обычно делают RSS-каналы доступными по специально созданным URL-адресам. Ссылка на URL канала обычно прикрепляется к сайту с помощью кнопки или логотипа RSS (также называемого иконкой канала). Современные программы для чтения каналов также могут использовать URL-адрес веб-сайта. В этом случае программа сама определяет URL канала.

В блоге IONOS ссылка на RSS-канал представлена следующим образом:

Кнопка «Subscribe RSS-Feed» связана с RSS URL blog.ionos.com/feed/. На других сайтах ссылки на RSS размещаются либо в нижнем колонтитуле, либо в навигационном списке.

Если пользователь Интернета обращается к URL-адресу ленты новостей, например blog.ionos.com/feed/, в своем браузере, большинство программ идентифицируют сохраненный XML-документ как ленту новостей, используя тег rss и другие соответствующие действия. Следующий снимок экрана демонстрирует это на примере Mozilla Firefox. Браузер интерпретирует семантически отличный текстовый документ XML как HTML-страницу и предлагает различные функции подписки в области заголовка сайта.

В дополнение к функции, позволяющей сохранить RSS-канал в виде динамической закладки, Firefox также предлагает возможность управления подпиской с помощью внешнего приложения.

Предоставление RSS-каналов

Для операторов веб-сайтов RSS-каналы являются хорошим способом регулярно информировать подписчиков о новых возможностях и побуждать их снова посетить веб-сайт. Когда речь идет об интернет-маркетинге, RSS-каналы рассматриваются как инструмент лояльности клиентов.

Чтобы оформить содержимое сайта в виде ленты, операторы имеют в своем распоряжении три варианта.

  • Ручное создание RSS-документа с помощью XML
  • Интеграция файлов с помощью внешних программ и веб-сервисов
  • Автоматизированный вывод RSS-документов с помощью системы управления контентом (CMS)    

Ручное создание RSS-каналов

В принципе, RSS-каналы можно создать без особых усилий. Основной XML-файл создается в классическом текстовом редакторе, а базовая схема RSS, рассмотренная ранее, служит в качестве шаблона.

1. Создайте текстовые файлы: На первом этапе базовая схема RSS заполняется содержимым соответствующего веб-сайта. Как правило, эти RSS-каналы содержат от 10 до 15 элементов.

<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0">
    <channel>
      <title>Channel name</title>
      <link>http://www.example.com/</link>
      <description>Description of channel</description>
      <item>
        <title>Article 1</title>
        <link>example.com/1</link>
        <guid>example.com/1</guid>
        <pubDate>Mo, 02. Nov. 2016, 13:20:00 GMT</pubDate>
        <description>Description of the first article</description>
      </item>
      <item>
        <title>Article 2</title>
        <link>example.com/2</link>
        <guid>example.com/2</guid>
        <pubDate>Tu, 01. Nov. 2016, 12:15:12 GMT</pubDate>
        <description>Description of the second article</description>
      </item>
  </channel>
</rss>

1. Сохранить текстовые файлы в формате XML: На втором этапе только что созданный текстовый документ сохраняется в виде XML-файла.

2. Опубликовать RSS-документ: Чтобы посетители сайта могли подписаться на созданный канал, XML-файл загружается на сервер и на него делается ссылка внутри сайта.

Преимущество RSS-канала, созданного вручную, заключается в том, что операторы сайта могут выбирать, какие именно статьи будут распространяться через этот канал. Недостатком является то, что обновление ленты также должно происходить вручную. Блоггеры и другие операторы сайтов, которые хотят регулярно информировать своих читателей о новых материалах, должны создавать соответствующую запись в XML-документе для каждой новой статьи на сайте. Чтобы документ не вышел из-под контроля, рекомендуется удалять самую старую запись по мере добавления каждой новой.

Из-за большого объема работы, необходимого для обновления RSS-каналов, на практике они редко создаются вручную.

Интеграция файлов через внешние программы и веб-сервисы

Если вы не хотите самостоятельно писать XML-документы, то можно воспользоваться программами и веб-сервисами, которые помогают операторам сайтов создавать, публиковать и поддерживать RSS-каналы.

  • RSS Builder: Бесплатная программа RSS Builder предлагает вам возможность вставлять записи RSS через хорошо структурированный пользовательский интерфейс и получать взамен XML-документ. Кроме того, программа предоставляет встроенный FTP-клиент, так что файл может быть загружен и с помощью этого инструмента. Ранее созданные XML-документы также могут быть открыты и обновлены с помощью RSS Builder. Недостатки: Программа доступна только для Windows 7 и требует наличия .NET framework 1.1. Кроме того, RSS Builder в настоящее время не разрабатывается.
  • Feedity Feed Builder: Веб-приложение Feedity Feed Builder предоставляет функции для чтения и автоматического структурирования динамических веб-сайтов. Для автоматического создания RSS-каналов пользователям достаточно иметь в качестве примера одну веб-страницу своего проекта. Семантическая разметка выполняется с помощью визуального селектора во фронтенде. Функция автовыбора автоматически переносит разметку на похожие элементы. RSS-каналы, созданные с помощью Feedity, автоматически обновляются при добавлении нового контента. Недостатки: Инструмент можно эффективно использовать только в том случае, если все функции были активированы путем подписки на платное обновление.

Создание RSS-канала с помощью CMS или программного обеспечения для блогов

Как правило, динамические веб-сайты создаются с помощью CMS или программного обеспечения для блогов. Преимущество этих систем в том, что весь контент уже семантически структурирован в базах данных, готов к отделению от презентационного слоя и генерируется динамически только в момент доступа. Чтобы опубликовать RSS-канал вместо веб-сайта, вам просто нужен другой шаблон, содержащий соответствующие спецификации представления. Функции RSS включены во все популярные системы управления контентом. Если содержимое сайта будет пересмотрено, то XML-документ также будет автоматически обновлен.

В зависимости от используемого программного обеспечения, сторонние программы, такие как Google FeedBurner, могут быть полезны для расширения CMS или программного обеспечения блога, чтобы включить функции RSS, а также аналитику и рекламу.

Интеграция внешнего контента в виде RSS-канала

Контент, семантически структурированный в виде стандартизированного XML-документа, идеально подходит для автоматической обработки. Это может включать обработку для различных устройств — в основном мобильных — и дает поставщикам контента возможность сделать свой контент доступным на различных медиа-каналах.

Операторы веб-сайтов иногда используют RSS для интеграции внешнего контента в свой сайт. Интеграция уже готового контента одного сайта в другой называется синдикацией. В Интернете можно найти множество сайтов, таких как блоги или форумы, которые используют RSS-каналы новостных порталов, а также соответствующие отраслевые сайты, которые предоставляют своим посетителям последние новости от представительных поставщиков контента. Такое многократное использование может быть в коммерческих рамках, но крупные новостные порталы допускают и некоммерческое использование своих RSS-лент. Как правило, это бесплатно, но они оставляют за собой право запретить передачу контента без объяснения причин.

Одним из простых программных решений для интеграции RSS-каналов является FeedWind от Mikle. Этот бесплатный инструмент можно найти на сайте https://feed.mikle.com/ в виде веб-приложения. Он предлагает все функции, необходимые операторам веб-сайтов для подготовки свободно распространяемых RSS-документов для собственных проектов.

Интеграция RSS-канала с помощью FeedWind легко осуществляется с помощью шести простых шагов:

1. Найдите подходящий RSS-канал: Обычно поставщики контента делают доступные RSS-каналы хорошо видимыми на сайте. Если такой канал будет использоваться для другого проекта, сначала необходимо определить URL-адрес XML-документа.

2. Импортируйте XML-данные по URL-адресу канала: Прежде чем обрабатывать RSS-канал для представления на собственном сайте, необходимо импортировать URL XML-документа в веб-приложение. FeedWind предлагает следующее поле ввода:

После ввода URL-адреса завершите импорт, нажав на кнопку, отмеченную знаком плюс (+).

После импорта FeedWind показывает предварительный просмотр виджета RSS в соответствии со стандартными настройками.

После этого операторы сайтов получают доступ к широкому спектру настроек, которые можно использовать для индивидуальной адаптации RSS-виджета к целевому сайту.

3. Общие настройки: В разделе общих настроек оператор сайта имеет возможность определить высоту и ширину виджета RSS. Если поле должно автоматически адаптироваться к дисплею используемого устройства, то это поле также может быть определено как отзывчивое.

Виджет FeedWind автоматически прокручивает различные элементы базового XML-документа. Кроме того, у посетителей сайта есть возможность поиска интересных записей с помощью полосы прокрутки. Обе функции можно отключить в общих настройках. Кроме того, можно задать скорость и направление анимации функции автопрокрутки.

В категории «стиль» операторы сайта могут настроить отображение содержимого RSS-виджета и выбрать между текстовым, эскизным и HTML вариантами. Нажав на «Дополнительные настройки», вы можете отобразить расширенные настройки.

Здесь операторы сайта могут определить, будут ли ссылки открываться в новом окне или нет, и какой шрифт будет использоваться для представления содержимого. Выравнивание текста также может быть определено в расширенных настройках.

Виджет FeedWind также может отображаться с нормальными или закругленными углами, а также с пограничными линиями или без них. Если вы хотите реализовать индивидуальную концепцию дизайна, то у вас также есть возможность импортировать собственный CSS.

4. Форматирование заголовка: FeedWind автоматически берет заголовок RSS-канала из XML-документа. При желании вы также можете ввести индивидуальный заголовок или указать ссылку на любой сайт.

Расширенные настройки цвета для отображения заголовка доступны в разделе «Дополнительные настройки». Вы также можете импортировать фоновое изображение.

5. Форматирование контента: Контент может отображаться в FeedWind в трех форматах: как список заголовков статей, как комбинация заголовков и тизеров или просто как список тизеров. Каждый элемент также может быть связан с источником.

Для размеров шрифта заголовков и тизеров, а также для количества отображаемых символов существуют индивидуальные параметры настройки. Вы также можете настроить цвета заголовков, текста тизеров и фона.

Кнопка «Дополнительные настройки» предоставляет дополнительные параметры отображения. Здесь пользователи могут определить, сколько элементов должно отображаться в виджете одновременно и в каком порядке. Возможные варианты: самые новые записи первыми, самые старые записи первыми или случайный порядок.

По желанию можно добавить разделительные линии, а также дату публикации в нужном формате.

6. Сгенерировать HTML-код: После ввода нужных настроек просто нажмите кнопку «Получить код», чтобы сгенерировать блок HTML-кода, включающий JavaScript с кодом виджета.

7. Интегрируйте исходный HTML-код сайта: Для публикации RSS-виджета, созданного с помощью FeedWind, операторам веб-сайтов нужно просто вставить код виджета в HTML-источник своего сайта.

Вместо включения внешних RSS-каналов FeedWind можно также использовать для предоставления обзора собственного содержимого сайта на главной странице.

RSS-каналы и SEO

В прошлом RSS-каналы иногда неправильно использовались в качестве источника обратных ссылок для поисковой оптимизации (SEO). Для этого операторы сайтов размещали каналы собственных страниц в различных RSS-каталогах. Однако с сегодняшней точки зрения такой подход больше не рекомендуется. Подобно дополнительным записям в веб-каталогах, поисковые системы могут правильно распознать и идентифицировать эту практику как форму спама. Поэтому RSS-каналы больше не рассматриваются как инструмент для построения ссылок. Однако потенциал для положительного влияния на SEO существует благодаря возможности генерировать трафик через каналы.

Агрегаторы новостей, такие как Yahoo News, Google News и Feedly, играют центральную роль: Все они основаны на RSS-каналах. Операторы сайтов, способные вставить свой собственный фид в эти сервисы, могут рассчитывать на непрерывный поток трафика.

Следует проявлять осторожность, если вы хотите интегрировать на свой сайт через RSS почти исключительно иностранный контент. Хотя в умеренных количествах это отличный ресурс, при слишком большом объеме он может нанести вред рейтингу вашей поисковой системы. Google и другие поисковые системы иногда классифицируют краткие описания, содержащиеся в ленте, как дублированный контент. Это особенно относится к сайтам, которые предоставляют мало или вообще не предоставляют собственного контента. Вы всегда должны задавать себе вопрос, действительно ли фид обогащает посетителей вашего сайта.

Оцените статью
cdelat.ru
Добавить комментарий