Ответ 1
Следующий ресурс поможет вам загрузить все страницы из категории и всех ее подкатегорий:
http://en.wikipedia.org/wiki/Wikipedia:CatScan
Здесь также доступен API:
Я хочу получить все названия статей под категорией и ее подкатегориями.
Параметры, о которых я знаю:
incategory:"music"
, но я не видел возможности просмотреть это в XML.Поделитесь своими мыслями
Следующий ресурс поможет вам загрузить все страницы из категории и всех ее подкатегорий:
http://en.wikipedia.org/wiki/Wikipedia:CatScan
Здесь также доступен API:
Вы можете сделать это с помощью следующих двух методов API:
YOUR_URL/api.php?action=query&format=json&list=categorymembers&cmtitle=Category:Music
YOUR_URL/api.php?action=query&format=json&list=categorymembers&cmtype=subcat&cmtitle=Category:Music
Вы можете получить дополнительную информацию по API Mediawiki
Обратите внимание, что система категоризации Википедии не является деревом или даже ациклическим графом. Вполне возможно, что, непрерывно следуя ссылкам подкатегории, вы, в конце концов, вернетесь туда, где вы начали.
Если вы собираетесь делать много таких запросов, вам лучше всего будет обслуживать загрузку базы данных. Если это будет редкость и будет иметь дело только с небольшими категориями, вы, вероятно, можете избежать повторных запросов list=categorymembers
.
incategory:"music"
не выполняет поиск подкатегорий.