Freebase: В каком файле дампа данных содержится "imdb_id"?
Я запускаю IMDbAPI.com и использую Bing Search API для поиска идентификатора IMDb из поиска по типу. Bing в настоящее время меняет свой API на Azure Marketplace (1 августа) и больше не доступен бесплатно. Я начал тестировать свой API с помощью Freebase, чтобы разрешить эти идентификаторы и достигнуть своего 100-кратного лимита за первые 8 часов (на моем сайте в настоящее время поступает около 3 миллионов запросов в день, но только 200-300 тыс. - поиск по ключевым словам)
Именно поэтому они предлагают файлы дампов данных,
Я загрузил большинство файлов в папке "Фильм", но не могу найти, где они хранят данные пространства имен iddb id//imdb/title.
https://www.googleapis.com/freebase/v1/mqlread?query= { "type" : "/film/film" , "name" : "Верно %20Grit" , "imdb_id" : NULL, "initial_release_date > =" : "1969-01" , "предел" : 1}
Вот как я сейчас обращаюсь к ID.
Кто-нибудь знает, какой файл содержит эту информацию? и как связать его с названием фильма/id?
Ответы
Ответ 1
Это свойство imdb_id
поддерживается ключом в пространстве имен /authority/imdb/title
, поэтому вы ищете строку:
/m/015gxt /type/object/key /authority/imdb/title tt0065126
в файле http://download.freebase.com/datadumps/latest/freebase-datadump-quadruples.tsv.bz2
Это файл размером 4 ГБ, поэтому будьте готовы немного подождать загрузки. Обратите внимание, что все связано с MID, поэтому сначала вам нужно понять это, если у вас его нет в вашей базе данных.
Эквивалентный запрос с использованием MQL вместо дампов данных https://www.googleapis.com/freebase/v1/mqlread?query=%7B% 22type% 22% 22% 3a/пленка/пленка 22%,% 22name% 22% 3a% 22True %20Grit% 22% 22imdb_id% 22% 3anull,% 22initial_release_date% 3E =% 22% 3a% 221969-01% 22, % 22mid% 22: null,% 22key% 22: [{% 22namespace% 22:% 22/authority/imdb/title% 22}],% 22limit% 22: 1% 7D & indent = 1
EDIT: p.s. Я уверен, что файлы в каталоге "Обзор" уходят, поэтому я не буду зависеть от них, даже если вы найдете там информацию.
Ответ 2
Предыдущий ответ работает отлично, просто, что более быстрая версия такого запроса может быть:
query = [{
'type': '/film/film',
'name': 'prometheus',
'imdb_id': null,
...
}];
Остальная часть запроса MQL не упоминается, поскольку она не отличается от упомянутого выше. Надеюсь, что это поможет.