Пометьте свой сайт с помощью RDFa в соответствии с рекомендациями Schema.org

RDFa (Resource Description Framework in Attributes) — это тип формата данных, рекомендованный Консорциумом Всемирной паутины (W3C) для встраивания утверждений RDF в HTML, XHTML и различные диалекты XML. Программисты используют структуру (RDF) для дальнейшего уточнения веб-контента с помощью метаданных. Это помогает программам, таким как веб-браузеры или поисковые машины, понять семантический контекст, что делает модель RDF фундаментальной технологией семантического веба. В качестве модуля XHTML модель RDFa была разработана в 2004 году, а в 2008 году стала рекомендованной W3C основой для встраивания. Версия 1.1 RDFa была выпущена в 2012 году и совместима как с HTML, так и с HTML5. В это же время на рынке появилась облегченная версия, названная RDFa Lite.

RDF в HTML

RDFa — это лишь один из многих способов аннотирования утверждений RDF. В ходе этого процесса выражения Resource Description Framework встраиваются в HTML, чтобы переработать веб-контент, написанный для человеческих пользователей, в машиночитаемые структурированные данные. Эта функция делает RDFa сопоставимым с другими форматами данных, предназначенными для семантического маркирования, такими как Microformats или Microdata. Однако, в отличие от этих других наименований, RDFa определяет только метасинтаксис для целей семантического тегирования.

Описание этих семантических контекстов с помощью метаданных требует унифицированного словаря, и у программистов есть широкий выбор, включая такие варианты, как: FOAF, SKOS, Dublin Core или SIOC. Google, Bing и Yahoo! рекомендуют размечать теги в соответствии со Schema.org — словарем, разработанным в рамках совместного проекта поисковых систем с целью стандартизации структурированных данных.

Разметка RDFa на практике

При встраивании метаданных спецификации RDFa вводят множество новых атрибутов, которые расширяют функции различных языков разметки документов (например, HTML, XHTML или HTML5). В следующем списке представлены атрибуты подмножества RDFa Lite:

Атрибут Описание
vocab Атрибут vocab определяет словарь, который является основой для тегирования элементов с помощью RDFa (например, Schema.org).
typeof С помощью атрибута typeof элементам присваиваются определенные темы (т.е. «типы») в соответствии с выбранным словарем.
property Этот атрибут присваивает свойства элементам. 
resource Атрибут resource позволяет программистам назначать отдельные термины, известные как «идентификаторы», различным элементам.  
префикс Атрибут prefix дает программистам возможность указать более одного словаря в случаях, когда исходный словарь недостаточен для желаемой маркировки. 

HTML-теги без индивидуальной семантики являются хорошим выбором для атрибутов RDFa. Именно поэтому метаданные часто встречаются в тегах div или span. По сути, утверждения RDF могут быть интегрированы через RDFa во все теги HTML. Обычно это осуществляется с помощью базовой схемы, приведенной ниже: 

<div vocab="http://Schema.org/" typeof="Schema">
  <span property="Characteristic">text element</span>
<div> 

Разметка почтового адреса с помощью RDFa

Следующий код показывает утверждение контактных данных в классическом формате HTML, который можно увидеть на бесчисленных веб-страницах:

<p>
  Google Inc.<br>
  P.O. Box 1234<br>
  Mountain View, CA<br>
  94043<br>
  United States<br>
</p>

В то время как люди сразу же понимают, что этот абзац текста, определенный тегом <p>, относится к адресной информации, программы, такие как веб-браузеры и поисковые машины, требуют дополнительных метаданных, чтобы понять смысл информации:

<p vocab="http://Schema.org/" typeof="PostalAddress"><br>
  <span property="name">Google Inc.</span><br>
  P.O. Box <span property="postOfficeBoxNumber">1234</span><br>
  <span property="addressLocality">Mountain View</span>,<br>
  <span property="addressRegion">CA</span><br>
  <span property="postalCode">94043</span><br>
  <span property="addressCountry">United States</span><br>
</p>

В строке 01 тег HTML, <p>, работает как основа для атрибутов RDFa ‘vocab’ и ‘typeof’. В данном конкретном случае программы, читающие код, помеченный таким образом, способны распознать два отдельных бита информации: что все сущности, содержащиеся в теге <p>, соответствуют словарю Schema.org и что они также были отнесены к типу ‘PostalAddress’. Согласно Schema.org, каждому типу могут быть присвоены определенные свойства. Что касается приведенного выше примера, атрибут RDFa ‘property’ используется для того, чтобы сделать адресные данные машиночитаемыми. Здесь адресные данные ‘name’, ‘postOfficeBoxNumber’, ‘addressLocality’, ‘addressRegion’, ‘postalCode’ и ‘addressCountry’ с соответствующими значениями помечены как свойства типа ‘PostalAddress’. Это позволяет программам, считывающим HTML-код, оценить, как следует интерпретировать информацию типа ‘Google Inc.’ или ‘94043’.

Маркировка веб-контента с помощью RDFa для Rich Snippets

Прежде всего, структурированные данные существуют для того, чтобы облегчить поиск в Интернете. Владельцы сайтов, которые семантически маркируют информацию на своей домашней странице, позволяют поисковым системам извлекать эти данные и отображать их с помощью таких функций, как Rich Snippets. Они содержат выдержки из веб-контента, которые отображаются в списках результатов поисковых систем (SERP), что позволяет им больше выделяться. Таким образом, семантическая аннотация способствует поисковой оптимизации сайта. Лидер рынка, Google, поддерживает разметку RDFa для Rich Snippets для таких типов данных, как рецепты, отзывы пользователей, программное обеспечение и новостные статьи. Rich Snippets для видео поддерживаются только в более современных форматах, таких как Microdata и JSON-LD. А для событий Rich Snippets должны быть помечены в JSON-LD. Ниже приведен пример того, как веб-контент может быть отредактирован для Rich Snippets:

Пометка отзывов о товарах с помощью RDFa

Обзоры товаров, которые появляются в SERPS в виде Rich Snippets, обычно содержат названия товаров, изображение товара, рейтинг (обычно в формате 1-5 звезд) и отзывы пользователей (которые включают имя автора, названия и даты). Следующий код показывает, как эта информация маркируется для машинной читаемости с помощью RDFa:

<div vocab="http://Schema.org/" typeof="Product">
  <img property="image" src=" productphoto.jpg" alt="image description"/>
  <span property="name">product name</span>
  <div property="review" typeof="Review"> Review:
    <span property="reviewRating" typeof="Rating">
      <span property="ratingValue">5</span> -
    </span>
    <b>‘<span property="name">Review Title</span>‘</b> by
    <span property="author" typeof="Person">
      <span property="name">author name</span>
    </span>, written on 
    <meta property="datePublished" content="2006-05-04">May 4 2006
    <div property="reviewBody">review text</div>
    <span property="publisher" typeof="Organization">
      <meta property="name" content="publisher name">
    </span>
  </div>
</div>

В первой строке кода в качестве словаря разметки используется тег Schema.org. Атрибут ‘typeof’ определяет строки с 01 по 18 как принадлежащие к стандартному типу ‘Product’. Словарь Schema.org позволяет продуктам проявлять множество свойств. В следующем примере продукту присвоены и семантически маркированы: название (property=name), изображение (property=’image’) и отзыв пользователя (property=’review’). Синтаксис RDFa позволяет описывать свойства как типы, которым затем также могут быть присвоены дополнительные индивидуальные свойства. Таким образом, свойство ‘Review’ в строке 04 может быть определено как тип ‘Review’ и затем уточнено, как показано в примере ниже:

 <div property="review" typeof="Review"> Review:

Многие пользовательские отчеты содержат отзывы на звездную тематику. Чтобы сделать их машиночитаемыми, тип ‘Review’ присваивается свойству ‘reviewRating’. Затем это свойство может быть описано как тип ‘Rating’ с помощью дополнительного свойства ‘ratingValue’ (строки 05 — 06).

  <div property="review" typeof="Review"> Review:
    <span property="reviewRating" typeof="Rating">
      <span property="ratingValue">5</span> -

Другими свойствами типа ‘Review’ являются: название (property=’name’), автор (property=’author’), дата публикации (property=’datePublished’), текст рецензии (property=’reviewBody’) и информация об издателе (property=’publisher’). Свойства информации об авторе и публикации могут быть снова определены как конкретные типы (например, люди или организации) и снабжены дополнительными свойствами (например, ‘name’). Важно учитывать, что каждый вторичный атрибут typeof в HTML-теге вложен в первичный атрибут typeof.

Это лишь один пример сложности разметки RDFa. Хотя она позволяет делать подробные аннотации, ее использование оказывается значительно сложнее, чем использование более современных форматов данных, таких как JSON-LD.

Оцените статью
cdelat.ru
Добавить комментарий