Микроданные или "microdata" - это новшество, которое было привнесено в мир глобальной сети с выходом новой редакции стандарта HTML5. Микроданные представляют собой компактную надстройку над обычной HTML-разметкой, являются логически связанными парами "имя-значение" и основаны на содержимом веб-страницы. Назначение микроданных - сделать текст не просто набором слов, но придать ему большее семантическое значение. Это значит, что поисковый робот, изучая содержимое вашего сайта, сможет составлять и анализировать связи между объектами, на которые вы хотите ему указать. Звучит слишком сложно? Давайте рассмотрим пример, и всё сразу станет понятно. 

Вы устраиваете мероприятие и пишите об этом на своём сайте, не используя семантическую разметку и микроданные. Конечно, поисковый робот найдёт в тексте ключевые слова, относящиеся к мероприятию, и отобразит в поисковой выдаче при запросе. Но дата, место проведения, тип мероприятия, поисковый робот, скорее всего, не сможет определить, и эти данные могут затеряться среди всей остальной информации на странице. При использовании же микроданных, вы сами указываете, что за меооприятие, когда и где.

Вот, например, выдача поисковика для какого-то детского мероприятия. Верхний сайт не использует возможности семантической разметки, а нижний - использует. Видите разницу? В первом случае вам нужно вчитываться в блок информации, чтобы узнать детали, а во втором случае вы сразу находите то, что нужно. 

Пример выдачи поисковика с микроданными и без них

И это только один из примеров использования микроданных. На самом деле их применение гораздо шире, и есть все основания полагать, что количество вариантов использования и число сайтов с микроданными будут только расти.

Как же это работает? Очень просто, достаточно добавить к обычной HTML-разметке несколько машиночитаемых атрибутов. Например, так выглядела бы наша разметка без микроданных:

<р>Детское представление «Щелкунчик» состоится 22 декабря в СК Олимпийский в Москве.р>

А вот так - с микроданными:

itemscope itemtype="мероприятие">Детское itemprop="название_мероприятия">представление «Щелкунчик»раn> состоится itemprop="дата">22 декабряраn> в itemprop="место_проведения">СК Олимпийскийраn> в Москве.р>

Здесь к основным html-тегам добавилось несколько новых атрибутов:

  • itemscope - задаёт область действия блока микроданных;
  • itemtype - задаёт тип микроданных;
  • itemprop - задаёт свойства, описываемые микроданными.

Например, в нашем случае поисковый робот выделит следующую информацию: 

  • тип данных: мероприятие;
  • название: «Щелкунчик»;
  • дата: 22 декабря;
  • место: СК Олимпийский.

И эти данные поисковый робот сможет обработать и преподнести пользователю в удобном виде, соответствующем запросу. В зависимости от типа микроданных это может быть, возможность внести событие в календарь, или добавление контакта человека в адресную книгу, или заказ товара, или покупка билета на самолёт/поезд/автобус и т.д. 

Но как поисковый робот узнает, что такое вообще слово «мероприятие»? Для этого нужно соблюдать некую договорённость, чтобы все использовали оин и тот же т.н. «словарь», из которого можно выбрать подходящий тип микроданных. В настоящее время таким словарём является сайт schema.orgи ещё несколько сайтов, в которых хранятся общепринятые словари микроданных. 

Чтобы использовать эти словари, нужно сначала выбрать подходящий тип данных. Типы данных указываются в виде URI. Например, для мероприятия подходящим типом из словаря будет тип "Event" с URI "http://schema.org/Event". Этот адрес может и не вести на реальную страницу в интернете, он используется лишь для идентификации типа микроданных. 

Таким образом, если переписать наш пример с использованием общепринятого словаря, получим такую разметку:

<р itemscope itemtype="http://schema.org/Event">Детское представление «Щелкунчик»раn> состоится itemprop="startDate">22 декабряраn> в itemprop="location">СК Олимпийскийраn> в Москве.р>