Normalisering forhindrer spildepladsens spild ved at minimere eller eliminere redundansen.
Sammenligningstabel
Grundlag for sammenligning | Normalisering | denormalisering |
---|---|---|
Grundlæggende | Normalisering er processen med at oprette et sæt skema for at gemme ikke-redundante og konsekvente data. | Denormalisering er processen med at kombinere dataene, så den kan forespørges hurtigt. |
Formål | At reducere data redundans og inkonsekvens. | For at opnå hurtigere udførelse af forespørgsler gennem indførelse af redundans. |
Brugt i | OLTP-system, hvor der lægges vægt på at gøre indsætningen, slette og opdatere uregelmæssigheder hurtigere og lagre kvalitetsdataene. | OLAP-system, hvor der lægges vægt på at gøre søgning og analyse hurtigere. |
Dataintegritet | vedligeholdt | Må ikke beholde |
Redundans | slået | Lagt |
Antal tabeller | Øger | Reducerer |
Diskplads | Optimeret brug | spild |
Definition af normalisering
Normalisering er metoden til at arrangere dataene i databasen effektivt. Det indebærer at opbygge tabeller og oprette forhold mellem disse tabeller i henhold til visse regler. Redundans og inkonsekvent afhængighed kan fjernes ved hjælp af disse regler for at gøre det mere fleksibelt.
Redundant data spilder diskplads, øger dataintegriteten og nedsætter DML-forespørgsler. Hvis de samme data er til stede på mere end et sted og enhver opdatering er begået på disse data, skal ændringen afspejles på alle steder. Uoverensstemmende data kan gøre datasøgning og adgang vanskeligere ved at miste vejen til den.
Der er forskellige grunde til at udføre normaliseringen, for eksempel for at undgå redundans, ajourføring af uregelmæssigheder, unødvendig kodning, opbevaring af dataene i den form, der kan rumme forandring lettere og mere præcist og håndhæve dataforholdet.
Normalisering omfatter analysen af funktionelle afhængigheder mellem attributter. Relationerne (tabellerne) nedbrydes med uregelmæssigheder for at skabe relationer til en struktur. Det hjælper med at bestemme hvilke attributter der skal grupperes i en relation.
Normaliseringen er grundlæggende baseret på begreberne normale formularer . En relationstabel siges at være i en normal form, hvis den opfylder et bestemt sæt begrænsninger. Der er 6 definerede normale former: 1NF, 2NF, 3NF, BCNF, 4NF og 5NF. Normalisering bør eliminere redundansen, men ikke på bekostning af integriteten.
Definition af denormalisering
Denormalisering er den inverse proces af normalisering, hvor det normaliserede skema konverteres til et skema, som har overflødig information. Ydelsen forbedres ved at bruge redundans og holde de overflødige data konsistente. Årsagen til at udføre denormalisering er de overhead, der produceres i forespørgselsprocessoren ved en over normaliseret struktur.
Denormalisering kan også defineres som metoden til lagring af forbindelsen med overordnede normale formrelationer som en basisforbindelse, som er i en lavere normal form. Det reducerer antallet af tabeller og kompliceret tabelforbindelser, fordi et større antal tilslutninger kan nedsætte processen. Der er forskellige denormaliseringsteknikker som: Lagring afledelige værdier, præforbindelsestabeller, hardkodede værdier og opbevaring af detaljer med master mv.
Her understreger denormaliseringsmetoden, at konceptet ved at placere alle dataene på ét sted kunne eliminere behovet for at søge de mange filer for at indsamle disse data. Den grundlæggende strategi følges i denormalisering er, hvor den mest afgørende proces er valgt for at undersøge de ændringer, der i sidste ende vil forbedre ydeevnen. Og den mest grundlæggende ændring er at tilføje flere attributter til den eksisterende tabel for at reducere antallet af tilslutninger.
Nøgleforskelle mellem normalisering og denormalisering
- Normalisering er teknikken til at opdele dataene i flere tabeller for at reducere dataredundans og inkonsekvens og for at opnå dataintegritet. På den anden side er denormalisering teknikken til at kombinere dataene i et enkelt bord for at gøre data hentning hurtigere.
- Normalisering bruges i OLTP- systemet, som understreger, at indsætningen, sletningen og opdateringen af uregelmæssigheder hurtigere. Modsat anvendes denormalisering i OLAP- systemet, hvilket understreger, at søgningen og analysen bliver hurtigere.
- Dataintegriteten opretholdes i normaliseringsprocessen, mens denormaliseringsdataets integritet er sværere at bevare.
- Redundante data elimineres, når normalisering udføres, mens denormalisering øger de overflødige data.
- Normalisering øger antallet af tabeller og tilslutter sig. I modsætning hertil reducerer denormalisering antallet af tabeller og deltager.
- Diskplads spildes i denormalisering, fordi de samme data gemmes på forskellige steder. Tværtimod er diskplads optimeret i et normaliseret bord.
Konklusion
Normalisering og denormalisering er nyttige ifølge situationen. Normalisering bruges, når den hurtigere indsættelse, sletning og opdatering af uregelmæssigheder og datakonsistens nødvendigvis kræves. På den anden side anvendes denormalisering, når den hurtigere søgning er vigtigere og for at optimere læseydelsen. Det mindsker også de generelle omkostninger, der er skabt af over normaliserede data eller komplicerede tabeller.