Skillnaden mellan fakta tabell och dimension tabell

Författare: Laura McKinney
Skapelsedatum: 1 April 2021
Uppdatera Datum: 13 Maj 2024
Anonim
High Density 2022
Video: High Density 2022

Innehåll


Faktabellen och dimensionstabellen är de väsentliga faktorerna för att skapa en schema. En faktabords rekord är en kombination av attribut från olika dimensionstabeller. Fakta tabell hjälper användaren att analysera affärsdimensionerna som hjälper honom att fatta beslut om att förbättra sin verksamhet. Å andra sidan hjälper dimensionstabeller faktabordet att samla in dimensioner längs vilka åtgärderna måste vidtas.

Poängen som skiljer fakta-tabellen och dimensionstabellen är att dimensionstabell innehåller attribut som åtgärder vidtas faktabord. Det finns några andra faktorer som skapar skillnader mellan fakta tabell och dimension tabell för att se dem, låt oss titta på jämförelsetabellen nedan.

  1. Jämförelsediagram
  2. Definition
  3. Figur
  4. Viktiga skillnader
  5. Slutsats

Jämförelsediagram

Grund för jämförelseFakta tabellDimensionstabell
GrundläggandeFakta tabell innehåller mätningen längs attributen i en dimensionstabell. Dimensionstabellen innehåller de attribut längs vilka faktatabeller beräknar metriken.
Attribut & poster Fakta tabell innehåller mindre attribut och fler poster.Dimensionstabellen innehåller fler attribut och mindre poster.
TabellstorlekFakta tabell växer vertikalt.Dimensionstabellen växer horisontellt.
Nyckel Fakta tabell innehåller en primär nyckel som är en sammanlänkning av primära nycklar i alla dimensionstabeller. Varje dimensionstabell innehåller sin primära nyckel.
SkapandeFakttabell kan bara skapas när dimensionstabeller är färdiga.Dimensionstabeller måste skapas först.
schema Ett schema innehåller mindre antal faktatabeller.Ett schema innehåller fler antal dimensionstabeller.
attributFakta tabell kan ha data i både numeriskt och ualformat.Dimensionstabellen innehåller alltid attribut i UAL-format.


Definition av fakta tabell

En faktatabell är en tabell som innehåller mätningar längs attributen för dimensionstabeller. Den kan innehålla informationen på lägsta möjliga nivå. Vissa faktatabeller innehåller bara sammanfattande data, kallad som Aggregerad fakta tabell. Faktabellen innehåller nästan datum stämplade data. Låt oss diskutera egenskaperna hos en faktabord.

Sammanhängande nyckel
Fakta tabell innehåller sammanlänkad nyckel som är sammanlänkningen av primära nycklar i alla dimensionstabeller. Den sammanlänkade nyckeln till faktatabellen måste identifiera raden i en faktatabell på ett unikt sätt.

Datakorn
Datakorn visar hur djupt mätningarna i faktatabellen har lagrats. Datakorn måste vara på den högsta möjliga nivån.


Tillsatsåtgärder
Faktatabellen kan vara helt tillsats eller semi-additiv. Helt tillsatsåtgärder är de som lätt kan sammanfattas för alla dimensioner i faktabordet. Till exempel är kvantitet_ordnad, ett attribut som kan summeras för alla dimensioner. Vi kan liksom ta ut total mängd_order, för en viss kund, region, datum, varumärke, etc. Halvadditivåtgärder är de som kan summeras längs vissa dimensioner av faktabord men inte alla dimensioner. Likaså kan balansbelopp inte summeras över tidsdimension eftersom det förändras över tiden.

Sparsam data
Ibland kan vi se de faktiska tabellerna som har attribut med nollåtgärder. Till exempel kanske det inte finns någon beställning på en semester. Så attribut för detta datum kommer att ha nollmått. Vi behöver inte lagra mått för sådan typ av poster eftersom det inte ger någon information.

Degenererade dimensioner
Ibland kanske du stöter på vissa dimensioner i faktabord, som inte är tillsatser alls. Till exempel ordernummer, kund_id, du kan inte lägga till dessa dimensioner. I fallet måste du dock hitta beställningar gjorda av en viss kund under den här månaden; då behöver du customer_id för att relatera din sökning. Dessa typer om attribut eller dimensioner för faktabord kallas Degenererad dimension.

Definition av dimensionstabell

Dimensionstabell är en nyckelkomponent för Start Schema.Dimensionstabellen innehåller de attribut som representerar dimensioner, längs vilka mätningen sker i faktumtabellen. Vidare kommer vi att diskutera några egenskaper hos en dimensionstabell.

Attribut och nycklar
Varje dimensionstabell måste ha en primärnyckel som identifierar varje post i tabellen på ett unikt sätt. Det observeras ofta att dimensionstabellen innehåller många attribut. Därför verkar det vara bred dvs. när du skapar en dimensionstabell hittar du den sprider sig vågrätt.

Attributvärden
Värdena för attributen i dimensionstabellen är sällan numeriska, de flesta gånger du hittar värdena i attributen är i UAL-format. Till exempel produktnamn, märke, kategori, underkategori etc.

Förhållande mellan attribut
Ofta kan du observera, attributen du stöter på i en dimensionstabell är inte direkt relaterade. Liksom har Product_brand ingenting att göra med package_date men ändå båda kan vara attributen för produktdimensionstabellen.

Normalisering
Dimensionstabellen är inte tänkt att vara normaliseras. Detta beror på att normalisering av en tabell skulle skapa många mellanliggande tabeller. När en fråga plockar upp ett attribut från dimensionstabellen och återvinner mätningar längs med det för faktabellen måste frågan gå igenom de mellanliggande tabellerna som blir ineffektiva. Därför normaliseras inte dimensionstabeller.

Borrar ner, rullar upp
Attribut i dimensionstabellen gör att du kan få detaljerna antingen genom att gå från högre nivå av aggregerade attribut till lägre nivåattribut. Om du till exempel vill hitta den totala försäljningen i en region kan du borra ner för att hitta försäljning efter stat, stad, postnummer. Du kan till och med rulla upp för att hitta den totala försäljningen först med zip, sedan efter stad och sedan stat.

Multipel hierarki
Ofta erbjuder dimensionstabeller flera hierarkier. Vi har till exempel en produktdimensionstabell för ett varuhus. Nu har vi två avdelningar marknads- och redovisningsavdelning.

Marknadsavdelningen kommer att borra ner bland attribut för produktdimensionstabellen i en viss hierarki för att få mätningar för faktabellen.

Å andra sidan kommer bokföringsavdelningen att borta ner bland attributen för produktdimensionstabellen i de olika hierarkierna för att få mätningar för faktabellen.

Så dimensionstabellen måste ha flera hierarkier eller nivån på aggregering av attribut för att låta användaren borra längs någon av de flera hierarkierna.

Uppgifter
Även om en dimensionstabell har för många attribut har den färre poster.

  1. Fakta tabell innehåller mätning längs dimensionen / attributen för en dimensionstabell.
  2. Fakta tabell innehåller fler poster och mindre attribut jämfört med dimensionstabell medan dimensioner tabell innehåller fler attribut och färre poster.
  3. Tabellstorleken på faktabordet växer vertikalt medan tabellstorleken på dimensionstabellen växer horisontellt.
  4. Varje dimensionstabell innehåller en primär nyckel för att identifiera varje post i tabellen medan faktatabellen innehåller sammanlänkad nyckel som är en kombination av alla primära nycklar i alla dimensionstabeller.
  5. Dimensionstabellen måste registreras innan faktabordet skapas.
  6. Ett schema innehåller färre faktatabeller men fler dimensionstabeller.
  7. Attribut i faktumtabellen är såväl numeriska som ual, men attribut för dimensionstabellen har endast UAL-attribut.

Slutsats:

Båda är lika viktiga för att skapa scheman men dimensionstabell måste registreras före faktabord. Eftersom det är omöjligt att skapa faktabord utan dimensioner.