Diferencia entre normalización y desnormalización

Normalización vs desnormalizaciónLa normalización y la desnormalización son los métodos utilizados en las bases de datos. Los términos son diferenciables donde la Normalización es una técnica de minimización de las anomalías de inserción, borrado y actualización mediante la eliminación de los datos redundantes. Por otro lado, la desnormalización es el proceso inverso a la normalización donde la redundancia se añade a los datos para mejorar el rendimiento de la aplicación específica y la integridad de los datos.

La normalización evita el desperdicio de espacio en disco minimizando o eliminando la redundancia.

Contenido: Normalización Vs Desnormalización

  1. Tabla de comparación
  2. Definición
  3. Claves de las diferencias
  4. Conclusión

Tabla de comparación

.

Propósito

.

Base de comparación Normalización Denormalización
Básico La normalización es el proceso de crear un esquema conjunto para almacenar datos noredundantes y consistentes. La desnormalización es el proceso de combinar los datos para que puedan ser consultados rápidamente.
Reducir la redundancia e inconsistencia de los datos. Lograr una ejecución más rápida de las consultas mediante la introducción de redundancia.
Utilizado en SistemaOLTP, donde se hace hincapié en agilizar las anomalías de inserción, borrado y actualización y en almacenar los datos de calidad. SistemaOLAP, donde se hace hincapié en agilizar la búsqueda y el análisis.
Integridad de los datos Mantenida Puede no conservarse
Redundancia Eliminada Agregado
Número de tablas Aumenta Disminuye
Espacio en disco Uso optimizado Despilfarro

Definición de normalización

La normalización es el método para organizar los datos en la base de datos de manera eficiente. Implica la construcción de tablas y el establecimiento de relaciones entre esas tablas de acuerdo con algunas reglas determinadas. La redundancia y la dependencia incoherente pueden eliminarse utilizando estas reglas para hacerla más flexible.

Los datos redundantes desperdician espacio en el disco, aumentan la incoherencia de los datos y ralentizan las consultas DML. Si los mismos datos están presentes en más de un lugar y se comete cualquier actualización en esos datos, entonces el cambio debe reflejarse en todas las ubicaciones. Los datos incoherentes pueden dificultar la búsqueda y el acceso a los datos al perderse la ruta de acceso a los mismos.

Existen varias razones para llevar a cabo la normalización, como evitar la redundancia, las anomalías de actualización, la codificación innecesaria, mantener los datos en la forma que puede acomodar el cambio con mayor facilidad y precisión y hacer cumplir la restricción de datos.

La normalización incluye el análisis de las dependencias funcionales entre los atributos. Las relaciones (tablas) se descomponen con anomalías para generar relaciones con una estructura. Ayuda a decidir qué atributos deben agruparse en una relación.

La normalización se basa básicamente en los conceptos de formas normales. Se dice que una tabla de relaciones está en una forma normal si cumple un determinado conjunto de restricciones. Hay 6 formas normales definidas: 1NF, 2NF, 3NF, BCNF, 4NF y 5NF. La normalización debe eliminar la redundancia pero no a costa de la integridad.

Definición de desnormalización

La desnormalización es el proceso inverso a la normalización, donde el esquema normalizado se convierte en un esquema que tiene información redundante. El rendimiento se mejora utilizando la redundancia y manteniendo los datos redundantes consistentes. La razón para realizar la desnormalización es la sobrecarga producida en el procesador de consultas por una estructura sobre-normalizada.

La desnormalización también puede definirse como el método de almacenar la unión de relaciones de forma normal superior como una relación base, que está en una forma normal inferior. Reduce el número de tablas, y las uniones de tablas complicadas porque un mayor número de uniones puede ralentizar el proceso. Existen varias técnicas de desnormalización como: Almacenamiento de valores derivables, pre-unión de tablas, valores codificados y mantener los detalles con el maestro, etc.

Aquí el enfoque de desnormalización, hace hincapié en el concepto de que al colocar todos los datos en un solo lugar, podría eliminar la necesidad de buscar esos múltiples archivos para recoger estos datos. La estrategia básica que se sigue en la desnormalización es, donde se selecciona el proceso más gobernante para examinar aquellas modificaciones que finalmente mejorarán el rendimiento. Y la alteración más básica es la de añadir múltiples atributos a la tabla existente para reducir el número de uniones.

Diferencias clave entre normalización y desnormalización

  1. La normalización es la técnica de dividir los datos en múltiples tablas para reducir la redundancia e inconsistencia de los datos y lograr la integridad de los mismos. Por otro lado, la desnormalización es la técnica de combinar los datos en una sola tabla para hacer que la recuperación de datos sea más rápida.
  2. La normalización se utiliza en el sistema OLTP, que hace hincapié en hacer que las anomalías de inserción, eliminación y actualización sean más rápidas. Por el contrario, la desnormalización se utiliza en el sistema OLAP, que hace hincapié en hacer la búsqueda y el análisis más rápido.
  3. La integridad de los datos se mantiene en el proceso de normalización, mientras que en la desnormalización la integridad de los datos es más difícil de mantener.
  4. Los datos redundantes se eliminan cuando se realiza la normalización, mientras que la desnormalización aumenta los datos redundantes.
  5. La normalización aumenta el número de tablas y uniones. Por el contrario, la desnormalización reduce el número de tablas y uniones.
  6. El espacio en disco se desperdicia en la desnormalización porque los mismos datos se almacenan en diferentes lugares. Por el contrario, el espacio en disco se optimiza en una tabla normalizada.

Conclusión

La normalización y la desnormalización son útiles según la situación. La normalización se utiliza cuando se requieren necesariamente las anomalías de inserción, borrado y actualización más rápidas, y la consistencia de los datos. Por otro lado, la desnormalización se utiliza cuando la búsqueda más rápida es más importante y para optimizar el rendimiento de la lectura. También disminuye los gastos generales creados por los datos excesivamente normalizados o las uniones de tablas complicadas.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *