Разница между таблицей фактов и таблицей измерений?

При чтении книги для бизнес-объектов я столкнулся с таблицей фактов term- и таблицей измерений.

Я пытаюсь понять, что отличается от таблицы измерений и таблицы фактов?

Я прочитал пару статей в Интернете, но я не мог четко понять.

Любой простой пример поможет мне лучше понять?

Ответы

Ответ 1

Это должно ответить на вопрос:

Я пытался понять, могут ли таблицы измерений быть таблицей фактов или нет?

Короткий ответ (INMO) - Нет. Это потому, что 2 типа таблиц создаются по разным причинам. Однако с точки зрения дизайна базы данных таблица измерений может иметь родительскую таблицу как случай с таблицей фактов, которая всегда имеет таблицу измерений (или больше) в качестве родителя. Кроме того, таблицы фактов могут быть агрегированы, тогда как таблицы измерений не агрегированы. Другая причина заключается в том, что таблицы фактов не должны обновляться, тогда как таблицы измерений могут быть обновлены в некоторых случаях.

Подробнее:

Таблицы фактов и измерений отображаются в том, что принято называть Star Star Schema. Основная цель звездной схемы - упростить сложный нормализованный набор таблиц и консолидировать данные (возможно, из разных систем) в одну структуру базы данных, которая может быть запрошена очень эффективным способом.

В простейшей форме он содержит таблицу фактов (пример: StoreSales) и одну или несколько таблиц измерений. Каждая запись Dimension имеет 0,1 или более связанных с ней таблиц фактов (пример таблиц измерений: география, элемент, поставщик, клиент, время и т.д.). Было бы справедливо также, чтобы размерность имела родительский элемент, и в этом случае модель имеет тип "Снежная хлопья". Тем не менее, дизайнеры пытаются избежать такого дизайна, поскольку это приводит к увеличению числа подключений, что приводит к низкой производительности. В примере StoreSales измерение Geography может состоять из столбцов (GeoID, ContenentName, CountryName, StateProvName, CityName, StartDate, EndDate)

В модели Snow Flakes вы могли бы иметь 2 нормализованных таблицы для геоинформации, а именно: Таблица контента, Таблица стран.

Вы можете найти множество примеров в Star Schema. Кроме того, проверьте это, чтобы увидеть альтернативный вид модели звездной схемы Inmon vs. Kimball. У Kimbal есть хороший форум, который вы также можете посетить здесь: Kimball Forum.

Изменение: Чтобы ответить на комментарий о примерах для 4NF:

  • Пример для таблицы фактов, нарушающей 4NF:

Фактор продаж (ID, BranchID, SalesPersonID, ItemID, Amount, TimeID)

  • Пример для таблицы фактов, не нарушающей 4NF:

Агрегированные продажи (BranchID, TotalAmount)

Здесь соотношение находится в 4NF

Последний пример довольно необычен.

Ответ 2

Это, по-видимому, очень простой ответ о том, как различать таблицы фактов и измерений!

Это может помочь думать о измерениях как о вещах или объектах. Такая вещь, как продукт, может существовать без участия в бизнес-мероприятии. Измерение - это ваше существительное. Это то, что может существовать независимо от бизнес-события, такого как продажа. Продукты, сотрудники, оборудование - все, что существует. Измерение либо что-то делает, либо что-то делает с ним.

Сотрудники продают, покупают покупатели. Работники и клиенты являются примерами размеров, они это делают.

Продукты продаются, они также являются размерами, поскольку они что-то делают с ними.

Факты, это глагол. Запись в таблице фактов представляет собой дискретное событие, которое происходит с чем-то из таблицы измерений. Продажа продукта будет занесена в таблицу фактов. Событие продажи будет отмечено тем, какой продукт был продан, какой сотрудник продал его, и какой клиент его купил. Продукт, Сотрудник и Клиент - это все измерения, описывающие событие, продажу.

Кроме того, таблицы фактов также обычно имеют некоторые количественные данные. Количество продано, цена за элемент, общая цена и так далее.

Источник: http://arcanecode.com/2007/07/23/dimensions-versus-facts-in-data-warehousing/

Ответ 3

В моделировании хранилищ данных схема звезд и схема снежинок состоят из таблиц фактов и измерений.

Таблица фактов:

  • Он содержит все первичные ключи измерения и связанные с ним факты или меры (это свойство, на котором могут быть сделаны расчеты), например, количество проданных, проданных объемов и средних продаж.

Таблицы размеров:

  • Таблицы измерений предоставляют описательную информацию для всех измерений, записанных в таблице фактов.
  • Размеры относительно очень малы по сравнению с таблицей фактов.
  • Обычно используемые размеры - это люди, продукты, место и время.

enter image description here

источник изображения

Ответ 4

Я нашел этот ответ более понятным с точки зрения человека, который мало знает о терминологии DB/DW.

http://databases.about.com/od/datamining/a/Facts-Vs-Dimensions.htm

Я порекомендую пройти это сначала, а затем перейду через ответ Эммада Карея для большей детализации. Надеюсь, это полезно.

Ответ 5

  1. Таблица фактов в основном состоит из бизнес-фактов и внешних ключей, которые относятся к первичным ключам в таблицах измерений. Таблица измерений состоит главным образом из описательных атрибутов, которые являются текстовыми полями.
  2. Таблица измерений содержит суррогатный ключ, естественный ключ и набор атрибутов. Напротив, таблица фактов содержит внешний ключ, измерения и вырожденные измерения.
  3. Таблицы измерений предоставляют описательную или контекстуальную информацию для измерения таблицы фактов. С другой стороны, таблицы фактов обеспечивают измерения предприятия.
  4. При сравнении размера двух таблиц таблица фактов больше, чем таблица размеров. В сравнительной таблице представлены больше измерений, чем таблицы фактов. В таблице фактов наблюдается меньшее количество фактов.
  5. Сначала необходимо загрузить таблицу размеров. При загрузке таблиц фактов нужно посмотреть таблицу измерений. Это связано с тем, что таблица фактов содержит измерения, факты и внешние ключи, которые являются первичными ключами в таблице измерений.

Подробнее: Таблица размеров и таблица фактов | Разница между | Таблица размеров против таблицы фактов http://www.differencebetween.net/technology/hardware-technology/dimension-table-and-fact-table/#ixzz3SBp8kPzo

Ответ 6

В простейшей форме я думаю, что таблица измерений - это что-то вроде таблицы "Мастер", которая хранит список всех "предметов", так сказать.

Таблица фактов - это таблица транзакций, которая описывает все транзакции. Кроме того, агрегированные (сгруппированные) данные, такие как общие продажи продавцом, общий объем продаж по отраслям - такие виды таблиц также могут существовать как независимые таблицы фактов.

Ответ 7

Таблица размеров: это ничего, но мы можем поддерживать информацию о охарактеризованной дате, называемой таблицей измерений.

Пример: размер времени, размер продукта.

Таблица фактов. Это не что иное, как мы можем поддерживать информацию о показателях или данных предварительной калькуляции.

Пример: факт факта продажи, факт заказа.

Звездная схема: одна ссылка таблицы фактов с формой таблицы размеров в качестве начальной схемы.

введите описание изображения здесь