База данных вопросов с однозначными числовыми ответами

I (и со-хакеры) строят своего рода мелочи, вдохновленные этим сообщением в блоге: http://messymatters.com/calibration. Идея состоит в том, чтобы дать доверительные интервалы и узнать, как откалибровать (когда вы "на 90% уверены", вы должны быть правы в 90% случаев).

Таким образом, мы ищем тысячи вопросов с однозначными численными ответами. Кроме того, они не должны быть слишком скучными. Существует множество случайных статистических данных - например, закрытая акватория в разных странах - это сделает игру ошеломляющей. Вещи, подобные датам выпуска классических фильмов, более интересны (для большинства людей).

Другие интересные, которые мы нашли, включают в себя олимпийские записи, медианные доходы для разных профессий, даты известных изобретений и знаменитости. Я, кстати, соскоблил такие вещи, как выше, поэтому я задал этот вопрос: Скопируйте таблицы HTML из заданного URL в CSV

Итак, если вы знаете другие источники интересных числовых фактов (в анализируемой форме), я с нетерпением жду их указателей. Спасибо!

Ответы

Ответ 1

Категория видеоигр

vgchartz.com имеют различные графики для названий видеоигр и производительности оборудования.

Примеры запросов:

Здесь достаточно данных для таких вопросов, как:

  • Сколько аппаратных/титульных X было продано в Год Y/первая неделя продаж?
  • Заголовок X outsells Название Y (в их первые N недель продаж) на сколько/какое отношение?

Популярная музыкальная категория

billboard.com - это все, что вам нужно.

Ссылки на Википедию

В дополнение к показателям продаж вы также можете задать вопросы о позициях диаграммы, например:

  • В категории Y диаграммы Z, где находится песня X/сколько песен у исполнителя X?

Максимальное использование ваших данных

Вы можете сделать однозначный числовой Q/A из большинства списков. Возьмем, к примеру, список, например TIME.com Все время 100 рождений

Некоторые общие вопросы, которые могут быть заданы, следующие:

  • Сколько писем за определенный период времени?
    • Десятилетие, год, в президенты Джорджа Буша, до 11 сентября и т.д.
  • Какая разница в ранге между заголовком X и заголовком Y?
    • Pairwise запросы, подобные этому, действительно используют большую часть ваших данных!

Вы можете сделать это с помощью всех списков Top 100:


Категория истории

historyorb.com - всего лишь один пример. URL-адреса и HTML-коды очень удобны.

Существует много подобных сайтов, например. brainyhistory.com.

Вы также можете использовать эти даты для "пересечения" с другими данными (например, пример Top 100 Novels выше).


Категория фильма

База данных интернет-фильмов - это, конечно же, база данных интернет-фильмов!

Ответ 2

Все статистические данные, которые когда-либо понадобится...


В Интернете доступно несколько "открытых" баз данных.

http://unstats.un.org/unsd/databases.htm

Просто потяните свои данные от них, и вы уже готовы!

ПРИМЕЧАНИЕ. Возможно, вам захочется кэшировать каждый вопрос после его вытаскивания для будущего повторного использования (другой пользователь).

GOODLUCK!!

CVS @2600Hertz

Ответ 3

Box Office Mojo - отличный способ узнать, сколько знаменитых фильмов собралось. Я думаю, что люди находят это интересным.

Ответ 4

Вы можете попробовать стучать в переднюю дверь:

Гранты Pioneer: гранты Pioneer доступны для стартапов и других разработчиков, создающих инновационные приложения с API Wolfram Alpha.

(http://products.wolframalpha.com/api/pricing.html)

Ответ 5

Хорошо, если вы хотите задать такие вопросы, как "какое население страны X?", "насколько высока самая высокая гора в Европе?" то это может быть ваш выбор:

http://www.dbis.informatik.uni-goettingen.de/Mondial/

База данных MONDIAL была скомпилирована из географических источников веб-данных перечисленные ниже:

  • CIA World Factbook,
  • предшественник Глобальной статистики, собранный Йоханом ван der Heijden.
  • дополнительные текстовые источники для координат,
  • Международный атлас Кюммерли и Фрея, Рэнда МакНалли и Вестермана,
  • и некоторые географические данные базы данных Карлсруэ TERRA.

Ответ 6

Спорные мелочи хорошо поддаются этому, так как вы можете найти массу вопросов, которые 1) имеют однозначные числовые ответы и 2) некоторые люди действительно заботятся. Я знаю, что загружаемая база данных для статистики бейсбола есть там, и я был бы удивлен, если бы вы не смогли найти похожие базы данных других крупных (и не очень-крупные) спорта. Вам все равно придется выбирать и выбирать, так как там слишком много мелочей даже для умелых любителей спорта ( "Сколько вычеркнул [скрытый кувшин] в 1923 году?" ), Но это должна быть богатая среда к моему.

Ответ 7

В Википедии есть несколько номеров, которые появляются неоднократно (часто в боковой панели), например, многие, если не большинство страниц телешоу, имеют ссылку на список эпизодов, а ссылка имеет количество эпизодов.

Ответ 8

Вопросы в этой игре идеально подходят для того, что мы имеем в виду:

http://en.wikipedia.org/wiki/Wits_and_Wagers

Интересно, как создатели Wits and Wagers собрали эти вопросы...

Ответ 9

Мировые факты (преступность, экономика, еда и т.д.)

http://www.nationmaster.com/facts.php

Знаете ли вы? (Факты | Быстрые Факты | Животные | История | Списки | Новости | Фобии)

http://didyouknow.org/

Ответ 10

Статистика крикета. Популярный с миллионами людей во всем мире и все доступные из невероятной базы данных на http://www.cricinfo.com. Настоятельно рекомендую.

Также книга фактов ЦРУ: https://www.cia.gov/library/publications/the-world-factbook/

имеет всевозможные полезные числовые факты о странах и т.д.

Ответ 11

WolframAlpha может быть хорошим местом для поиска числовых данных во всех категориях.