База данных вопросов с однозначными числовыми ответами
I (и со-хакеры) строят своего рода мелочи, вдохновленные этим сообщением в блоге:
http://messymatters.com/calibration.
Идея состоит в том, чтобы дать доверительные интервалы и узнать, как откалибровать (когда вы "на 90% уверены", вы должны быть правы в 90% случаев).
Таким образом, мы ищем тысячи вопросов с однозначными численными ответами.
Кроме того, они не должны быть слишком скучными.
Существует множество случайных статистических данных - например, закрытая акватория в разных странах - это сделает игру ошеломляющей.
Вещи, подобные датам выпуска классических фильмов, более интересны (для большинства людей).
Другие интересные, которые мы нашли, включают в себя олимпийские записи, медианные доходы для разных профессий, даты известных изобретений и знаменитости.
Я, кстати, соскоблил такие вещи, как выше, поэтому я задал этот вопрос:
Скопируйте таблицы HTML из заданного URL в CSV
Итак, если вы знаете другие источники интересных числовых фактов (в анализируемой форме), я с нетерпением жду их указателей.
Спасибо!
Ответы
Ответ 1
Категория видеоигр
vgchartz.com имеют различные графики для названий видеоигр и производительности оборудования.
Примеры запросов:
Здесь достаточно данных для таких вопросов, как:
- Сколько аппаратных/титульных X было продано в Год Y/первая неделя продаж?
- Заголовок X outsells Название Y (в их первые N недель продаж) на сколько/какое отношение?
Популярная музыкальная категория
billboard.com - это все, что вам нужно.
Ссылки на Википедию
В дополнение к показателям продаж вы также можете задать вопросы о позициях диаграммы, например:
- В категории Y диаграммы Z, где находится песня X/сколько песен у исполнителя X?
Максимальное использование ваших данных
Вы можете сделать однозначный числовой Q/A из большинства списков. Возьмем, к примеру, список, например TIME.com Все время 100 рождений
Некоторые общие вопросы, которые могут быть заданы, следующие:
- Сколько писем за определенный период времени?
- Десятилетие, год, в президенты Джорджа Буша, до 11 сентября и т.д.
- Какая разница в ранге между заголовком X и заголовком Y?
- Pairwise запросы, подобные этому, действительно используют большую часть ваших данных!
Вы можете сделать это с помощью всех списков Top 100:
Категория истории
historyorb.com - всего лишь один пример. URL-адреса и HTML-коды очень удобны.
Существует много подобных сайтов, например. brainyhistory.com.
Вы также можете использовать эти даты для "пересечения" с другими данными (например, пример Top 100 Novels выше).
Категория фильма
База данных интернет-фильмов - это, конечно же, база данных интернет-фильмов!
Ответ 2
Все статистические данные, которые когда-либо понадобится...
В Интернете доступно несколько "открытых" баз данных.
http://unstats.un.org/unsd/databases.htm
Просто потяните свои данные от них, и вы уже готовы!
ПРИМЕЧАНИЕ. Возможно, вам захочется кэшировать каждый вопрос после его вытаскивания для будущего повторного использования (другой пользователь).
GOODLUCK!!
CVS @2600Hertz
Ответ 3
Box Office Mojo - отличный способ узнать, сколько знаменитых фильмов собралось. Я думаю, что люди находят это интересным.
Ответ 4
Вы можете попробовать стучать в переднюю дверь:
Гранты Pioneer: гранты Pioneer доступны для стартапов и других разработчиков, создающих инновационные приложения с API Wolfram Alpha.
(http://products.wolframalpha.com/api/pricing.html)
Ответ 5
Хорошо, если вы хотите задать такие вопросы, как "какое население страны X?", "насколько высока самая высокая гора в Европе?" то это может быть ваш выбор:
http://www.dbis.informatik.uni-goettingen.de/Mondial/
База данных MONDIAL была скомпилирована из географических источников веб-данных перечисленные ниже:
- CIA World Factbook,
- предшественник Глобальной статистики, собранный Йоханом ван der Heijden.
- дополнительные текстовые источники для координат,
- Международный атлас Кюммерли и Фрея, Рэнда МакНалли и Вестермана,
- и некоторые географические данные базы данных Карлсруэ TERRA.
Ответ 6
Спорные мелочи хорошо поддаются этому, так как вы можете найти массу вопросов, которые 1) имеют однозначные числовые ответы и 2) некоторые люди действительно заботятся. Я знаю, что загружаемая база данных для статистики бейсбола есть там, и я был бы удивлен, если бы вы не смогли найти похожие базы данных других крупных (и не очень-крупные) спорта. Вам все равно придется выбирать и выбирать, так как там слишком много мелочей даже для умелых любителей спорта ( "Сколько вычеркнул [скрытый кувшин] в 1923 году?" ), Но это должна быть богатая среда к моему.
Ответ 7
В Википедии есть несколько номеров, которые появляются неоднократно (часто в боковой панели), например, многие, если не большинство страниц телешоу, имеют ссылку на список эпизодов, а ссылка имеет количество эпизодов.
Ответ 8
Вопросы в этой игре идеально подходят для того, что мы имеем в виду:
http://en.wikipedia.org/wiki/Wits_and_Wagers
Интересно, как создатели Wits and Wagers собрали эти вопросы...
Ответ 9
Мировые факты (преступность, экономика, еда и т.д.)
http://www.nationmaster.com/facts.php
Знаете ли вы? (Факты | Быстрые Факты | Животные | История | Списки | Новости | Фобии)
http://didyouknow.org/
Ответ 10
Статистика крикета. Популярный с миллионами людей во всем мире и все доступные из невероятной базы данных на http://www.cricinfo.com. Настоятельно рекомендую.
Также книга фактов ЦРУ: https://www.cia.gov/library/publications/the-world-factbook/
имеет всевозможные полезные числовые факты о странах и т.д.
Ответ 11
WolframAlpha может быть хорошим местом для поиска числовых данных во всех категориях.