Ответ 1
Dimension и Fact являются ключевыми терминов в OLAP.
- Таблица фактов содержит данные, которые могут быть агрегированы.
- Меры представляют собой агрегированные выражения данных (например, сумма затрат, количество вызовов,...)
- Размер содержит данные, которые используются для создания групп и фильтров.
- Таблица фактов без данных измерений бесполезна. Образец: "сумма заказов - 1M" - это не информация, а "сумма заказов с 2005 по 2009 год".
У них много инструментов BI, которые работают с этими понятиями (например, Microsft SSAS, Tableau Software) и языки (например MDX).
Несколько раз нелегко узнать, являются ли данные мерой или размером. Например, мы анализируем revenue
, оба сценария возможны:
- 3 меры:
net profit
,overheads
,interest
- 1 measure:
profit
и 1 размер:profit type
(с 3 элементами: нетто, накладные расходы, проценты)
Аналитик BI определяет, что является лучшим дизайном для каждого решения.
EDITED из-за вопроса, который также редактируется:
Решение OLAP обычно имеет семантический уровень. Этот уровень предоставляет информацию инструмента OLAP о том, какие элементы являются данными фактов, элементами которых являются данные измерения и отношения таблицы. В отличие от OLTP-систем, не требуется нормальная нормализация базы данных OLAP. По этой причине вы можете принимать данные измерений из нескольких таблиц, включая таблицы фактов. Измерение, которое берет данные из таблицы фактов, называется "Размер факта" или "Вырожденный размер" .
Это много концепций, которые вы должны учитывать при разработке баз данных OLAP: "STAR Schema", "SNOWFLAKE Schema", "Surrogate keys", "parent-child hierarchies",...