Разница между таблицей фактов и таблицей измерений?

при чтении книги для бизнес-объектов, я наткнулся на этот термин - таблица фактов и таблицы измерений.

Я пытаюсь понять, в чем разница между таблицей измерений и таблицей фактов?

Я прочитал пару статей в интернете, но я не смог четко понять..

любой простой пример поможет мне лучше понять?

7 ответов


Это, чтобы ответить на часть:

Я пытался понять, могут ли таблицы измерений быть таблицей фактов так хорошо или нет?

короткий ответ (INMO) - нет.Это связано с тем, что 2 типа таблиц создаются по разным причинам. Однако с точки зрения дизайна базы данных таблица измерений может иметь родительскую таблицу, как в случае с таблицей фактов, которая всегда имеет таблицу измерений (или более) в качестве родительской. Кроме того, таблицы фактов могут быть агрегированные, тогда как таблицы измерений не агрегируются. Другая причина заключается в том, что таблицы фактов не должны обновляться на месте, тогда как таблицы измерений могут обновляться на месте в некоторых случаях.

Подробнее:

таблицы фактов и измерений отображаются в так называемой схеме звезд. Основная цель схемы star-упростить сложный нормализованный набор таблиц и объединить данные (возможно, из разных систем) в одну структуру базы данных, которая можно запросить очень эффективным способом.

в своей простейшей форме он содержит таблицу фактов (пример: StoreSales) и одну или несколько таблиц измерений. Каждая запись имеет размер 0,1 или несколько таблиц фактов, связанных с ним (пример таблицы измерений: география, товар, поставщик, заказчик, время и т. д.). Было бы также допустимо, чтобы размер имел родителя, и в этом случае модель имеет тип "Снежинка". Тем не менее, дизайнеры пытаются избежать такого дизайна, поскольку он вызывает больше присоединяется к этой медленной производительности. В Примере StoreSales измерение Geography может состоять из столбцов (GeoID, ContenentName, CountryName, StateProvName, CityName, StartDate, EndDate)

в модели снежных хлопьев вы можете иметь 2 нормализованные таблицы для геоинформации, а именно: таблица контента, таблица стран.

вы можете найти множество примеров на схеме Star. Кроме того, проверьте это, чтобы увидеть альтернативное представление модели схемы звезды Инмона и Кимбалл!--18-->. Кимбал имеет хороший форум, который вы также можете проверить здесь:Кимбалл Форума.

Edit: чтобы ответить на комментарий о примерах для 4NF:

  • пример для таблицы фактов, нарушающей 4NF:

факт продажи (ID, BranchID, SalesPersonID, ItemID, сумма, TimeID)

  • пример таблицы фактов, не нарушающей 4NF:

AggregatedSales (BranchID, TotalAmount)

здесь отношение находится в 4NF

последний пример довольно необычен.


Это, по-видимому, очень простой ответ о том, как различать таблицы фактов и измерений!

Это может помочь думать о измерениях как о вещах или объектах. Вещь такая как продукт может существовать без участия в бизнесе событие. Измерение существительного. Это то, что может существовать независимо от бизнес-события, такого как продажа. Продукты, сотрудники, оборудование-это все, что существует. Измерение либо делает что-то, или что-то с ним сделали.

сотрудники продают, клиенты покупают. Сотрудники и клиенты являются примерами размеры, они делают.

продукты проданы, они также размеры по мере того как они имеют что-то с ними покончено.

факты, это глагол. Запись в таблице фактов отмечает дискретное событие это происходит с чем-то из таблицы измерений. Продажа продукта будет записываться в таблицу фактов. В случае продажи будет отмечено, какой продукт был продано, какой сотрудник продал его, а какой покупатель купил его. Продукт, сотрудник и клиент-все измерения это описание события, продажи.

кроме того, таблицы фактов также обычно имеют какой-то количественный данные. Количество проданное, цена в деталь, полная цена, и так далее.

источник: http://arcanecode.com/2007/07/23/dimensions-versus-facts-in-data-warehousing/


в моделировании хранилища данных a звезда-схемы и снежинки-схемы состоит из факт и измерение таблицы.

Таблица Фактов:

  • содержит все первичные ключи измерения и связанные с ними факты или меры(свойство, на котором могут быть сделаны расчеты), как количество продано, количество продано и средние продажи.

Размер Таблицы:

  • таблицы измерений предоставляют описательную информацию для всех измерений, записанных в таблице фактов.
  • размеры относительно очень малы как сравнение таблицы фактов.
  • обыкновенно используемые размеры люди, продукты, место и время.

enter image description here

Источник изображения


Я нашел этот ответ легче понять с точки зрения человека, который не знает много терминологии DB/DW.

http://databases.about.com/od/datamining/a/Facts-Vs-Dimensions.htm

Я рекомендую сначала пройти через это, а затем пройти через ответ Эммада Карима для большей детализации. Надеюсь, это поможет.


  1. таблица фактов в основном состоит из бизнес-фактов и внешних ключей, которые ссылаются на первичные ключи в таблицах измерений. Таблица измерений состоит в основном из описательных атрибутов, которые являются текстовыми полями.
  2. таблица измерений содержит суррогатный ключ, естественный ключ и набор атрибутов. Напротив, таблица фактов содержит внешний ключ, измерения и вырожденные измерения.
  3. таблицы измерений предоставляют описательную или контекстную информацию для измерение таблицы фактов. С другой стороны, таблицы фактов обеспечивают измерения предприятия.
  4. при сравнении размера двух таблиц таблица фактов больше, чем размерная таблица. В таблице сравнения представлено больше измерений, чем в таблицах фактов. В таблице фактов наблюдается меньшее количество фактов.
  5. таблица измерений должна быть загружена первой. При загрузке таблиц фактов необходимо посмотреть таблицу измерений. Это потому что таблица фактов содержит меры, факты и внешние ключи, являющиеся первичными ключами в таблице измерений.

Подробнее: таблица измерений и таблица фактов / разница между таблицей измерений и таблицей фактовhttp://www.differencebetween.net/technology/hardware-technology/dimension-table-and-fact-table/#ixzz3SBp8kPzo


в простейшей форме я думаю, что таблица измерений-это что - то вроде "главной" таблицы, которая хранит список всех "элементов", так сказать.

таблица фактов - это таблица транзакций, которая описывает все транзакции. Кроме того, агрегированные (сгруппированные) данные, такие как общий объем продаж по продавцам, общий объем продаж по отраслям - такие таблицы также могут существовать в качестве независимых таблиц фактов.


таблица измерений: это ничего, но мы можем поддерживать информацию о охарактеризованной дате, называемой таблицей измерений.

Пример : Измерение Времени , Измерение Продукта.

таблица фактов: это ничего, но мы можем поддерживать информацию о метриках или данных предварительного расчета.

Пример: Факт Продаж, Факт Заказа.

Star schema: одна ссылка таблицы фактов с формой таблицы измерений в качестве начальной схемы.

enter описание изображения здесь