Разница между таблицей фактов и таблицей измерений?
при чтении книги для бизнес-объектов, я наткнулся на этот термин - таблица фактов и таблицы измерений.
Я пытаюсь понять, в чем разница между таблицей измерений и таблицей фактов?
Я прочитал пару статей в интернете, но я не смог четко понять..
любой простой пример поможет мне лучше понять?
7 ответов
Это, чтобы ответить на часть:
Я пытался понять, могут ли таблицы измерений быть таблицей фактов так хорошо или нет?
короткий ответ (INMO) - нет.Это связано с тем, что 2 типа таблиц создаются по разным причинам. Однако с точки зрения дизайна базы данных таблица измерений может иметь родительскую таблицу, как в случае с таблицей фактов, которая всегда имеет таблицу измерений (или более) в качестве родительской. Кроме того, таблицы фактов могут быть агрегированные, тогда как таблицы измерений не агрегируются. Другая причина заключается в том, что таблицы фактов не должны обновляться на месте, тогда как таблицы измерений могут обновляться на месте в некоторых случаях.
Подробнее:
таблицы фактов и измерений отображаются в так называемой схеме звезд. Основная цель схемы star-упростить сложный нормализованный набор таблиц и объединить данные (возможно, из разных систем) в одну структуру базы данных, которая можно запросить очень эффективным способом.
в своей простейшей форме он содержит таблицу фактов (пример: StoreSales) и одну или несколько таблиц измерений. Каждая запись имеет размер 0,1 или несколько таблиц фактов, связанных с ним (пример таблицы измерений: география, товар, поставщик, заказчик, время и т. д.). Было бы также допустимо, чтобы размер имел родителя, и в этом случае модель имеет тип "Снежинка". Тем не менее, дизайнеры пытаются избежать такого дизайна, поскольку он вызывает больше присоединяется к этой медленной производительности. В Примере StoreSales измерение Geography может состоять из столбцов (GeoID, ContenentName, CountryName, StateProvName, CityName, StartDate, EndDate)
в модели снежных хлопьев вы можете иметь 2 нормализованные таблицы для геоинформации, а именно: таблица контента, таблица стран.
вы можете найти множество примеров на схеме Star. Кроме того, проверьте это, чтобы увидеть альтернативное представление модели схемы звезды Инмона и Кимбалл!--18-->. Кимбал имеет хороший форум, который вы также можете проверить здесь:Кимбалл Форума.
Edit: чтобы ответить на комментарий о примерах для 4NF:
- пример для таблицы фактов, нарушающей 4NF:
факт продажи (ID, BranchID, SalesPersonID, ItemID, сумма, TimeID)
- пример таблицы фактов, не нарушающей 4NF:
AggregatedSales (BranchID, TotalAmount)
здесь отношение находится в 4NF
последний пример довольно необычен.
Это, по-видимому, очень простой ответ о том, как различать таблицы фактов и измерений!
Это может помочь думать о измерениях как о вещах или объектах. Вещь такая как продукт может существовать без участия в бизнесе событие. Измерение существительного. Это то, что может существовать независимо от бизнес-события, такого как продажа. Продукты, сотрудники, оборудование-это все, что существует. Измерение либо делает что-то, или что-то с ним сделали.
сотрудники продают, клиенты покупают. Сотрудники и клиенты являются примерами размеры, они делают.
продукты проданы, они также размеры по мере того как они имеют что-то с ними покончено.
факты, это глагол. Запись в таблице фактов отмечает дискретное событие это происходит с чем-то из таблицы измерений. Продажа продукта будет записываться в таблицу фактов. В случае продажи будет отмечено, какой продукт был продано, какой сотрудник продал его, а какой покупатель купил его. Продукт, сотрудник и клиент-все измерения это описание события, продажи.
кроме того, таблицы фактов также обычно имеют какой-то количественный данные. Количество проданное, цена в деталь, полная цена, и так далее.
источник: http://arcanecode.com/2007/07/23/dimensions-versus-facts-in-data-warehousing/
в моделировании хранилища данных a звезда-схемы и снежинки-схемы состоит из факт и измерение таблицы.
Таблица Фактов:
- содержит все первичные ключи измерения и связанные с ними факты или меры(свойство, на котором могут быть сделаны расчеты), как количество продано, количество продано и средние продажи.
Размер Таблицы:
- таблицы измерений предоставляют описательную информацию для всех измерений, записанных в таблице фактов.
- размеры относительно очень малы как сравнение таблицы фактов.
- обыкновенно используемые размеры люди, продукты, место и время.
Я нашел этот ответ легче понять с точки зрения человека, который не знает много терминологии DB/DW.
http://databases.about.com/od/datamining/a/Facts-Vs-Dimensions.htm
Я рекомендую сначала пройти через это, а затем пройти через ответ Эммада Карима для большей детализации. Надеюсь, это поможет.
- таблица фактов в основном состоит из бизнес-фактов и внешних ключей, которые ссылаются на первичные ключи в таблицах измерений. Таблица измерений состоит в основном из описательных атрибутов, которые являются текстовыми полями.
- таблица измерений содержит суррогатный ключ, естественный ключ и набор атрибутов. Напротив, таблица фактов содержит внешний ключ, измерения и вырожденные измерения.
- таблицы измерений предоставляют описательную или контекстную информацию для измерение таблицы фактов. С другой стороны, таблицы фактов обеспечивают измерения предприятия.
- при сравнении размера двух таблиц таблица фактов больше, чем размерная таблица. В таблице сравнения представлено больше измерений, чем в таблицах фактов. В таблице фактов наблюдается меньшее количество фактов.
- таблица измерений должна быть загружена первой. При загрузке таблиц фактов необходимо посмотреть таблицу измерений. Это потому что таблица фактов содержит меры, факты и внешние ключи, являющиеся первичными ключами в таблице измерений.
Подробнее: таблица измерений и таблица фактов / разница между таблицей измерений и таблицей фактовhttp://www.differencebetween.net/technology/hardware-technology/dimension-table-and-fact-table/#ixzz3SBp8kPzo
в простейшей форме я думаю, что таблица измерений-это что - то вроде "главной" таблицы, которая хранит список всех "элементов", так сказать.
таблица фактов - это таблица транзакций, которая описывает все транзакции. Кроме того, агрегированные (сгруппированные) данные, такие как общий объем продаж по продавцам, общий объем продаж по отраслям - такие таблицы также могут существовать в качестве независимых таблиц фактов.
таблица измерений: это ничего, но мы можем поддерживать информацию о охарактеризованной дате, называемой таблицей измерений.
Пример : Измерение Времени , Измерение Продукта.
таблица фактов: это ничего, но мы можем поддерживать информацию о метриках или данных предварительного расчета.
Пример: Факт Продаж, Факт Заказа.
Star schema: одна ссылка таблицы фактов с формой таблицы измерений в качестве начальной схемы.