Anbefalet, 2024

Redaktørens Valg

Forskel mellem faktabord og dimensionstabel

Fact Table og Dimension Table er de væsentlige faktorer for at skabe et skema . Et faktabordets rekord er en kombination af attributter fra forskellige dimensionstabeller. Fact table hjælper brugeren med at analysere forretningsdimensionerne, som hjælper ham med at træffe beslutning om at forbedre sin forretning. På de øvrige hænder hjælper dimensionstabeller faktabordet til at samle dimensioner, hvorigennem foranstaltningerne skal tages.

Det punkt, der skelner mellem Faktabord og Dimensionstabellen, er, at dimensionstabellen indeholder attributter sammen med hvilke foranstaltninger der tages i virkeligheden . Der er nogle andre faktorer, der skaber forskelle mellem Fact Table og Dimension Table for at se dem, lad os få et overblik på sammenligningsdiagrammet nedenfor.

Sammenligningstabel

Grundlag for sammenligningFact TableDimensionstabel
GrundlæggendeFact table indeholder måling langs attributterne af en dimension tabel.Dimensionstabellen indeholder attributterne langs hvilken faktabord beregner metrinet.
Egenskab og optegnelserFact table indeholder færre attributter og flere poster.Dimensionstabellen indeholder flere attributter og færre poster.
TabelstørrelseFakta tabellen vokser lodret.Dimensionstabellen vokser vandret.
NøgleFakta tabel indeholder en primærnøgle, som er en sammenkædning af primærnøgler for alle dimensionstabeller.Hver dimensionstabel indeholder sin primære nøgle.
SkabelseFakta tabel kan kun oprettes, når dimensionstabeller er gennemført.Dimensionstabeller skal oprettes først.
SchemaEt skema indeholder mindre antal faktabord.Et skema indeholder flere antal dimensionstabeller.
EgenskaberFact table kan have data i numerisk såvel som tekstformat.Dimensionstabellen indeholder altid attributter i tekstformat.

Definition af Fact Table

Et faktabord er en tabel, der indeholder målinger langs attributterne af dimensionstabeller. Det kan indeholde informationen på lavest mulige niveau. Nogle faktabord indeholder kun summariske data, kaldet Aggregated Fact Table . Fakta tabellen indeholder næsten datoen stemplet data. Lad os diskutere egenskaberne ved en faktabord.

Sammenkædet nøgle
Fakta tabel indeholder Konkateret nøgle, som er sammenkædning af primærnøgler for alle dimensionstabellerne. Den sammenfattede nøgle i faktabordet skal unikt identificere rækken i en faktabord.

Datakorn
Datakorn viser, hvor dybt målingen faktisk er gemt. Datakorn skal være på det højeste niveau.

Tilsætningsforanstaltninger
Attributter af faktabordet kan være fuldt additiv eller semiadditiv . Fuldt additiv foranstaltninger er dem, der nemt kan opsummeres for alle dimensioner i virkeligheden bord. For eksempel quantity_ordered er en attribut som kan opsummeres for alle dimensioner. Ligesom vi kan udtage total mængdeordre, for en bestemt kunde, region, dato, mærke osv. Halvtilsætningsforanstaltninger er dem, der kan summeres langs nogle dimensioner af faktabordet, men ikke alle dimensioner. Ligesom, balance beløb kan ikke opsummeres over tid dimension som det ændrer sig over tid.

Sparsomme data
Nogle gange kan vi muligvis se de faktiske poster, der har attributter med null-foranstaltninger . For eksempel kan der ikke være nogen ordre på en ferie. Så attributter til denne dato vil have null foranstaltninger. Vi behøver ikke at lagre foranstaltning til sådanne slags optegnelser, da det ikke giver nogen oplysninger.

Degenererede dimensioner
Nogle gange kan du komme på tværs af nogle dimensioner faktisk bord, som ikke er additiv overhovedet. For eksempel ordrenummer, kunde_id, kan du ikke tilføje disse typer dimensioner. Men i tilfælde af, skal du finde ordre foretaget af en bestemt kunde i denne måned; så skal du bruge customer_id til at relatere din søgning. Disse typer, hvis attributter eller dimensioner af faktabord kaldes Degenerated Dimension .

Definition af dimensionstabel

Dimensionstabel er en nøglekomponent for Start Schema. En dimensionstabel indeholder de attributter, der repræsenterer dimensioner, hvorigennem målingen er taget i virkeligheden. Endvidere vil vi diskutere nogle egenskaber ved en dimensionstabel.

Attributter og nøgler
Hver Dimensionstabel skal have en primærnøgle, der unikt identificerer hver post af bordet. Det observeres almindeligvis, at dimensionstabellen indeholder mange attributter. Det ser derfor ud til at være bredt, dvs. når du opretter en dimensionstabel, finder du det spredt vandret .

Attributværdier
Værdierne af attributterne i dimensionstabellen er sjældent numeriske. De fleste gange vil du finde værdierne i attributter er i tekstformat . For eksempel produktnavn, mærke, kategori, underkategori osv.

Forholdet mellem attributter
Ofte kan du observere, de attributter du står over i en dimensionstabel er ikke direkte relaterede. Ligesom, Product_brand skal ikke gøre noget med package_date, men begge kan stadig være attributterne til produktdimensionstabellen.

Normalisering
Dimensionstabellen skal ikke normaliseres . Dette skyldes, at normalisering af et bord ville skabe mange mellemliggende tabeller. Når en forespørgsel opfanger en attribut fra dimensionstabellen og genopretter målinger langs den for faktabordet, skal forespørgslen gå gennem de mellemliggende tabeller, som bliver ineffektive. Derfor er dimensionstabeller ikke normaliseret.

Boring ned, rullende op
Attributter af dimensionstabellen giver dig mulighed for at få detaljerne enten ved at krydse fra højere niveau af aggregerede attributter til lavere niveauattributter. For eksempel, hvis du vil finde det samlede salg i en region, så kan du bore ned for at finde salg efter stat, by, zip. Du kan endda rulle op for at finde det samlede salg først ved postkortet, derefter efter by og derefter stat.

Flere hierarki
Ofte dimension tabellen tilbyder flere hierarkier. For eksempel har vi en produktdimensionstabel til en afdeling butik. Nu har vi to afdelinger marketing og regnskab afdeling.

Markedsafdelingen vil bore ned blandt attributter af produktdimensionstabellen i et bestemt hierarki for at opnå målinger for faktabordet.

På andre hænder vil regnskabsafdelingen bore ned blandt attributterne af produktdimensionstabellen i det forskellige hierarki for at opnå målinger for faktabordet.

Dimensionstabellen skal derfor have flere hierarkier eller aggregeringsniveauer for attributter, så brugeren kan træde ned langs et af de flere hierarkier.

Records
Selvom en dimensionstabel har for mange attributter, har den færre optegnelser.

Nøgleforskelle mellem faktabord og dimensionstabel

  1. Fact table indeholder måling langs dimensionen / attributterne af en dimensionstabel.
  2. Fact table indeholder flere poster og mindre attributter i forhold til dimensionstabellen, mens dimensionstabellen indeholder flere attributter og færre poster.
  3. Tabellen størrelse faktabordet vokser lodret, mens tabellen størrelse dimension tabellen vokser vandret.
  4. Hver dimensionstabel indeholder en primærnøgle for at identificere hver post i tabellen, mens faktabordet indeholder sammenkædede nøgler, som er en kombination af alle primærnøgler for alle dimensionstabeller.
  5. Dimensionstabellen skal indspilles før oprettelsen af ​​faktabordet.
  6. Et skema indeholder færre faktaborde, men flere dimensionstabeller.
  7. Attributter faktisk tabel er numeriske såvel som tekstmæssige, men attributter af dimensionstabellen har kun tekstmæssige attributter.

Konklusion:

Begge er lige så vigtige for oprettelse af skema, men dimensionstabellen skal registreres før faktabord. Da det er umuligt at oprette faktabord med ud dimensioner.

Top