Как получить результат "всех страниц с префиксом" с помощью Wikipedia api?
Я хочу использовать Wikipedia api для извлечения результата этой страницы:
http://en.wikipedia.org/wiki/Special:PrefixIndex
При поиске на нем "что-то", например:
http://en.wikipedia.org/w/index.php?title=Special%3APrefixIndex&prefix=tal&namespace=4
Затем я хотел бы получить доступ к каждой из полученных страниц и извлечь их информацию.
Какой api-вызов я могу использовать?
Ответы
Ответ 1
Вы можете использовать list=allpages
и указать apprefix
. Например:
http://en.wikipedia.org/w/api.php?format=xml&action=query&list=allpages&apprefix=tal&aplimit=max
Этот запрос даст вам идентификатор и заголовок каждой статьи, которая начинается с tal
. Если вы хотите получить дополнительную информацию о каждой странице, вы можете использовать этот список как generator:
http://en.wikipedia.org/w/api.php?format=xml&action=query&generator=allpages&gapprefix=tal&gaplimit=max&prop=info
Вы можете указать разные значения для параметра prop
для получения различной информации о странице.