Разница между таблицей фактов и таблицей измерений?
При чтении книги для бизнес-объектов я столкнулся с таблицей фактов term- и таблицей измерений.
Я пытаюсь понять, что отличается от таблицы измерений и таблицы фактов?
Я прочитал пару статей в Интернете, но я не мог четко понять.
Любой простой пример поможет мне лучше понять?
Ответы
Ответ 1
Это должно ответить на вопрос:
Я пытался понять, могут ли таблицы измерений быть таблицей фактов или нет?
Короткий ответ (INMO) - Нет. Это потому, что 2 типа таблиц создаются по разным причинам. Однако с точки зрения дизайна базы данных таблица измерений может иметь родительскую таблицу как случай с таблицей фактов, которая всегда имеет таблицу измерений (или больше) в качестве родителя. Кроме того, таблицы фактов могут быть агрегированы, тогда как таблицы измерений не агрегированы. Другая причина заключается в том, что таблицы фактов не должны обновляться, тогда как таблицы измерений могут быть обновлены в некоторых случаях.
Подробнее:
Таблицы фактов и измерений отображаются в том, что принято называть Star Star Schema. Основная цель звездной схемы - упростить сложный нормализованный набор таблиц и консолидировать данные (возможно, из разных систем) в одну структуру базы данных, которая может быть запрошена очень эффективным способом.
В простейшей форме он содержит таблицу фактов (пример: StoreSales) и одну или несколько таблиц измерений. Каждая запись Dimension имеет 0,1 или более связанных с ней таблиц фактов (пример таблиц измерений: география, элемент, поставщик, клиент, время и т.д.). Было бы справедливо также, чтобы размерность имела родительский элемент, и в этом случае модель имеет тип "Снежная хлопья". Тем не менее, дизайнеры пытаются избежать такого дизайна, поскольку это приводит к увеличению числа подключений, что приводит к низкой производительности. В примере StoreSales измерение Geography может состоять из столбцов (GeoID, ContenentName, CountryName, StateProvName, CityName, StartDate, EndDate)
В модели Snow Flakes вы могли бы иметь 2 нормализованных таблицы для геоинформации, а именно: Таблица контента, Таблица стран.
Вы можете найти множество примеров в Star Schema. Кроме того, проверьте это, чтобы увидеть альтернативный вид модели звездной схемы Inmon vs. Kimball. У Kimbal есть хороший форум, который вы также можете посетить здесь: Kimball Forum.
Изменение: Чтобы ответить на комментарий о примерах для 4NF:
- Пример для таблицы фактов, нарушающей 4NF:
Фактор продаж (ID, BranchID, SalesPersonID, ItemID, Amount, TimeID)
- Пример для таблицы фактов, не нарушающей 4NF:
Агрегированные продажи (BranchID, TotalAmount)
Здесь соотношение находится в 4NF
Последний пример довольно необычен.
Ответ 2
Это, по-видимому, очень простой ответ о том, как различать таблицы фактов и измерений!
Это может помочь думать о измерениях как о вещах или объектах. Такая вещь, как продукт, может существовать без участия в бизнес-мероприятии. Измерение - это ваше существительное. Это то, что может существовать независимо от бизнес-события, такого как продажа. Продукты, сотрудники, оборудование - все, что существует. Измерение либо что-то делает, либо что-то делает с ним.
Сотрудники продают, покупают покупатели. Работники и клиенты являются примерами размеров, они это делают.
Продукты продаются, они также являются размерами, поскольку они что-то делают с ними.
Факты, это глагол. Запись в таблице фактов представляет собой дискретное событие, которое происходит с чем-то из таблицы измерений. Продажа продукта будет занесена в таблицу фактов. Событие продажи будет отмечено тем, какой продукт был продан, какой сотрудник продал его, и какой клиент его купил. Продукт, Сотрудник и Клиент - это все измерения, описывающие событие, продажу.
Кроме того, таблицы фактов также обычно имеют некоторые количественные данные. Количество продано, цена за элемент, общая цена и так далее.
Источник: http://arcanecode.com/2007/07/23/dimensions-versus-facts-in-data-warehousing/
Ответ 3
В моделировании хранилищ данных схема звезд и схема снежинок состоят из таблиц фактов и измерений.
Таблица фактов:
- Он содержит все первичные ключи измерения и связанные с ним факты или меры (это свойство, на котором могут быть сделаны расчеты), например, количество проданных, проданных объемов и средних продаж.
Таблицы размеров:
- Таблицы измерений предоставляют описательную информацию для всех измерений, записанных в таблице фактов.
- Размеры относительно очень малы по сравнению с таблицей фактов.
- Обычно используемые размеры - это люди, продукты, место и время.
источник изображения
Ответ 4
Я нашел этот ответ более понятным с точки зрения человека, который мало знает о терминологии DB/DW.
http://databases.about.com/od/datamining/a/Facts-Vs-Dimensions.htm
Я порекомендую пройти это сначала, а затем перейду через ответ Эммада Карея для большей детализации. Надеюсь, это полезно.
Ответ 5
- Таблица фактов в основном состоит из бизнес-фактов и внешних ключей, которые относятся к первичным ключам в таблицах измерений. Таблица измерений состоит главным образом из описательных атрибутов, которые являются текстовыми полями.
- Таблица измерений содержит суррогатный ключ, естественный ключ и набор атрибутов. Напротив, таблица фактов содержит внешний ключ, измерения и вырожденные измерения.
- Таблицы измерений предоставляют описательную или контекстуальную информацию для измерения таблицы фактов. С другой стороны, таблицы фактов обеспечивают измерения предприятия.
- При сравнении размера двух таблиц таблица фактов больше, чем таблица размеров. В сравнительной таблице представлены больше измерений, чем таблицы фактов. В таблице фактов наблюдается меньшее количество фактов.
- Сначала необходимо загрузить таблицу размеров. При загрузке таблиц фактов нужно посмотреть таблицу измерений. Это связано с тем, что таблица фактов содержит измерения, факты и внешние ключи, которые являются первичными ключами в таблице измерений.
Подробнее: Таблица размеров и таблица фактов | Разница между | Таблица размеров против таблицы фактов http://www.differencebetween.net/technology/hardware-technology/dimension-table-and-fact-table/#ixzz3SBp8kPzo
Ответ 6
В простейшей форме я думаю, что таблица измерений - это что-то вроде таблицы "Мастер", которая хранит список всех "предметов", так сказать.
Таблица фактов - это таблица транзакций, которая описывает все транзакции. Кроме того, агрегированные (сгруппированные) данные, такие как общие продажи продавцом, общий объем продаж по отраслям - такие виды таблиц также могут существовать как независимые таблицы фактов.
Ответ 7
Таблица размеров: это ничего, но мы можем поддерживать информацию о охарактеризованной дате, называемой таблицей измерений.
Пример: размер времени, размер продукта.
Таблица фактов. Это не что иное, как мы можем поддерживать информацию о показателях или данных предварительной калькуляции.
Пример: факт факта продажи, факт заказа.
Звездная схема: одна ссылка таблицы фактов с формой таблицы размеров в качестве начальной схемы.
введите описание изображения здесь