Микроданные, RDFa или JSON-LD Соответствующее или лучшее использование?
Мне интересно, какой из этих форматов "лучший"? Schema.org, Microdata и RDFa немного больны для реализации. Они могут нарушить валидацию и потребовать довольно много усилий для внесения документов.
JSON-LD, наконец, для меня, способ лучше реализовать структурированные данные. Но работает ли это? Какой уровень поддержки для него (по крайней мере, у Google)?
Ответы
Ответ 1
Schema.org - это словарь, который может, как и любой другой словарь, использоваться во многих формах. На веб-сайте http://schema.org/ есть примеры с использованием Microdatastrong > , а синтаксисы RDF RDFa и JSON-LD, но это не единственные синтаксисы, с которыми он может быть использован. Например, вы можете использовать его с любым другим синтаксисом RDF, например Turtle или RDF/XML.
Нет лучшего синтаксиса. Все они имеют преимущества и недостатки. См. Например, мой ответ о различиях между Microdata и RDFa. Обратите внимание, что вы можете использовать разные синтаксисы (и словари) в том же документе.
Теперь, если у вас есть конкретный потребитель, вы должны проконсультироваться со своей документацией. Однако поддержка синтаксисов приходит и уходит, и не все, что они могут поддерживать, обязательно документируется, и не все, что документировано, обязательно работает.
В случае Google вы, вероятно, заинтересованы в их богатых фрагментах. Их документация о богатых фрагментах упоминает Microdata, Microformats и RDFa. Однако обратите внимание, что не все связанные примеры используют словарь Schema.org, но более старые Data-vocabulary.org или Microformats (поскольку вы не можете использовать словари, такие как Schema.org или Data-vocabulary.org с микроформатами). Кроме того, есть несколько Rich Snippets, которые присутствуют на этой странице, например "Поисковый ящик ссылок" , для которых они даже рекомендуют синтаксис JSON-LD.
Как общий совет: поисковые системы обычно предпочитают видимое содержимое по скрытым метаданным. Например, наличие ключевых слов в виде скрытых метаданных позволяет авторам утверждать, что их документы касаются чего-то другого, чем они есть на самом деле (либо из-за попытки обмануть поисковую систему, либо потому, что авторы забывают обновлять контент в обоих местах). Следовательно, расцепление метаданных из контента, как и его случай с JSON-LD, может (возможно!) Привести к тем же проблемам, что и текущие поисковые системы со скрытыми метаданными. (Если или какие поисковые системы фактически обрабатывают его, это вопрос, который не соответствует теме.)
Другим возможным преимуществом для соединения метаданных с контентом (например, с RDFa) является то, что вы можете легко и автоматически генерировать ту же информацию в JSON-LD, Turtle и т.д., потому что все просто RDF. Просто проанализируйте RDFa, конвертируйте в форматы ваших предпочтений и вставьте (в script
) или ссылку (с rel
- alternate
), если это имеет смысл.
Но да, добавление RDFa часто сложнее, чем добавление BLOB JSON-LD, потому что вам нужно адаптировать его к существующей разметке. (Тем не менее, он не должен "прерывать проверку", если вы не совершаете ошибок.)
Ответ 2
Линии между Микроданные, RDFa и JSON-LD действительно в настоящее время очень размыты и что до сих пор не принято общепризнанного де-факто среди трех. Это придется ждать сейчас. Возможно, пару или несколько лет.
Между тем, Microdata не должен быть помечен Schema.org, как вы упомянули, потому что эти два - разные вещи. Schema.org - это словарь, поэтому его можно использовать для Microdata, RDFa и JSON-LD.
Использование Schema.org в качестве словаря и использование JSON-LD, поскольку представление данных, вероятно, является самой ожидаемой парой из-за двух общих аспектов:
- Легко читается для людей; и
- Легкий машиносчитываемый
но даже при этом все еще есть разъединения между ними, например этот пример.
Что касается поддержки JSON-LD, так как Bing, Google, Yahoo!, и Яндекс подтверждает использование schema.org, возможно, это можно с уверенностью сказать, что они также поддерживают его, как в в этом примере.
Обновление 2017
Google был очень активен в продвижении JSON -LD-schema.org за последние пару или три года.
Ответ 3
Кажется, Google склоняется к использованию JSON-LD, но он не реализовал его для каждого случая использования!
Google в процессе добавления поддержки JSON-LD больше функции с разметкой. Пока что JSON-LD поддерживается для всех Знания Графические функции, дополнительные поля поиска, Event Rich Snippets, и рецепты Rich Snippets; Google рекомендует использовать JSON-LD для эти особенности. Для оставшихся типов Rich Snippets и панировочных сухарей, Google рекомендует использовать микроданные или RDFa.
http://developers.google.com/structured-data/schema-org
Ответ 4
Google использует JSON-LD в качестве ссылочных примеров для структурированных данных SEO для своего графика знаний (компании и люди).
См. https://developers.google.com/structured-data/customize/overview
Я лично использую комбинацию JSON-LD и Microdata для моих сайтов (пока).
Я бы сказал, что у них есть другие способы определить, соответствует ли информация, которую вы предоставляете через JSON-LD, их поисковой системе (например, проверка вашей страницы на самом деле говорит о том, о чем она говорит).
Ответ 5
(обновление ответов!)
О "популярности", см. этот вопрос/ответы.
Microdata сегодня является самой популярной: во вселенной из 34 миллионов доменов 5,63 миллиона (~ 17%) используют "разметку контента" (я буду использовать ярлык разметки) с помощью RDFa (0, 9 миллионов), Microdata (2,5 миллиона) или Microformats, и менее половины используют разделенные семантические дескрипторы, замечая наиболее популярные как JSON-LD, с 2,12 миллиона (6 %).
PS: мы предпочитаем" статистику по каждому домену" (вместо статистики по каждой странице), потому что страницы в одном домене в целом имеют одинаковые шаблоны и другие принудительные соглашения с местными органами власти.
В юниверсе "областей, выражающих семантику" (7,75 млн.) статистический профиль:
- 73% разметки семантический
- 27% разделенных семантических
- (... пересечение как "разделенная + разметка" в миксе может быть нулевой, чтобы упростить...)
эмпирическое правило в 2017 году
Используйте семантику разметки с помощью Microdatastrong > и после нее, если вам нужно что-то больше выражать машинам, использовать JSON-LD.
Использовать семантику разметки, потому что она является самой популярной, и потому что помеченные контент будут проверяться/проверяться одновременно людьми и машинами.
Важно: помните, что Microdata, RDFa (стандарт W3C) и JSON-LD (стандарт W3C) могут быть (легко) переведены в RDF, поэтому все эти форматы совместимы.
PS: для таблиц HTML см. также табличные метаданные W3C. Для открытых ресурсов, отличных от HTML, в качестве файлов CSV используйте RDF-совместимую табличную модель данных W3C и/или frictionlessdata/specs.