Différence entre normalisation et dénormalisation

Normalisation vs dénormalisationLa normalisation et la dénormalisation sont les méthodes utilisées dans les bases de données. Les termes sont différenciables : la normalisation est une technique permettant de minimiser les anomalies d’insertion, de suppression et de mise à jour en éliminant les données redondantes. D’autre part, la dénormalisation est le processus inverse de la normalisation où la redondance est ajoutée aux données pour améliorer les performances de l’application spécifique et l’intégrité des données.

La normalisation empêche le gaspillage d’espace disque en minimisant ou en éliminant la redondance.

Contenu : Normalisation Vs Dénormalisation

  1. Tableau de comparaison
  2. Définition
  3. Différences clés
  4. Conclusion

Tableau de comparaison

.

.

.

Base de comparaison Normalisation Dénormalisation
Basic La normalisation est le processus de création d’un schéma fixe pour stocker des données nonredondantes et cohérentes. La dénormalisation est le processus de combinaison des données afin qu’elles puissent être interrogées rapidement.
Objectif Réduire la redondance et l’incohérence des données. Pour obtenir l’exécution plus rapide des requêtes en introduisant la redondance.
Utilisé dans Le systèmeOLTP, où l’accent est mis sur l’accélération des anomalies d’insertion, de suppression et de mise à jour et sur le stockage des données de qualité. Le systèmeOLAP, où l’accent est mis sur l’accélération des recherches et des analyses.
Intégrité des données Maintien Peut ne pas conserver
Redondance Éliminée Ajouté
Nombre de tables Augmentation Diminution
Espace disque Utilisation optimisée Dégâts

.

Définition de la normalisation

La normalisation est la méthode permettant d’organiser efficacement les données dans la base de données. Elle consiste à construire des tables et à établir des relations entre ces tables selon certaines règles. La redondance et la dépendance incohérente peuvent être supprimées en utilisant ces règles afin de la rendre plus flexible.

Les données redondantes gaspillent de l’espace disque, augmentent l’incohérence des données et ralentissent les requêtes DML. Si les mêmes données sont présentes à plusieurs endroits et qu’une mise à jour est engagée sur ces données, alors le changement doit être reflété dans tous les emplacements. Les données incohérentes peuvent rendre la recherche et l’accès aux données plus difficiles en perdant le chemin d’accès à celles-ci.

Il y a diverses raisons derrière l’exécution de la normalisation, telles que l’évitement de la redondance, la mise à jour des anomalies, le codage inutile, le maintien des données dans la forme qui peut accueillir le changement plus facilement et plus précisément et l’application de la contrainte de données.

La normalisation comprend l’analyse des dépendances fonctionnelles entre les attributs. Les relations (tables) sont décomposées avec des anomalies pour générer des relations avec une structure. Elle aide à décider quels attributs doivent être regroupés dans une relation.

La normalisation est essentiellement basée sur les concepts de formes normales. On dit d’une table de relation qu’elle est dans une forme normale si elle remplit un certain ensemble de contraintes. Il existe 6 formes normales définies : 1NF, 2NF, 3NF, BCNF, 4NF et 5NF. La normalisation doit éliminer la redondance mais pas au prix de l’intégrité.

Définition de la dénormalisation

La dénormalisation est le processus inverse de la normalisation, où le schéma normalisé est converti en un schéma qui a des informations redondantes. La performance est améliorée en utilisant la redondance et en gardant les données redondantes cohérentes. La raison d’effectuer la dénormalisation est les surcharges produites dans le processeur de requête par une structure sur-normalisée.

La dénormalisation peut également être définie comme la méthode de stockage de la jointure des relations de forme normale supérieure comme une relation de base, qui est dans une forme normale inférieure. Elle réduit le nombre de tables, et les jointures de tables compliquées car un nombre plus élevé de jointures peut ralentir le processus. Il existe différentes techniques de dénormalisation telles que : Le stockage des valeurs dérivables, la pré-jonction des tables, les valeurs codées en dur et le maintien des détails avec le maître, etc.

Ici l’approche de dénormalisation, met l’accent sur le concept qu’en plaçant toutes les données dans un seul endroit, pourrait éliminer le besoin de rechercher ces multiples fichiers pour collecter ces données. La stratégie de base est suivie dans la dénormalisation est, où le processus le plus de décision est sélectionné pour examiner ces modifications qui vont finalement améliorer la performance. Et la modification la plus basique est que l’ajout de plusieurs attributs à la table existante pour réduire le nombre de jointures.

Différences clés entre la normalisation et la dénormalisation

  1. La normalisation est la technique de division des données en plusieurs tables pour réduire la redondance et l’incohérence des données et pour atteindre l’intégrité des données. En revanche, la dénormalisation est la technique qui consiste à combiner les données dans une seule table pour rendre la récupération des données plus rapide.
  2. La normalisation est utilisée dans le système OLTP, qui met l’accent sur l’accélération des anomalies d’insertion, de suppression et de mise à jour. Par contre, la dénormalisation est utilisée dans le système OLAP, qui met l’accent sur le fait de rendre la recherche et l’analyse plus rapides.
  3. L’intégrité des données est maintenue dans le processus de normalisation alors que dans la dénormalisation l’intégrité des données est plus difficile à conserver.
  4. Les données redondantes sont éliminées lors de la normalisation alors que la dénormalisation augmente les données redondantes.
  5. La normalisation augmente le nombre de tables et de jointures. En revanche, la dénormalisation réduit le nombre de tables et de jointures.
  6. L’espace disque est gaspillé lors de la dénormalisation car les mêmes données sont stockées à différents endroits. Au contraire, l’espace disque est optimisé dans une table normalisée.

Conclusion

La normalisation et la dénormalisation sont utiles selon la situation. La normalisation est utilisée lorsque les anomalies d’insertion, de suppression et de mise à jour plus rapides, ainsi que la cohérence des données sont nécessairement requises. D’autre part, la dénormalisation est utilisée lorsque la recherche plus rapide est plus importante et pour optimiser les performances de lecture. Elle permet également de diminuer les frais généraux créés par des données sur-normalisées ou des jointures de tables compliquées.

.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *