Base de datos distribuida frente a base de datos centralizada
La base de datos centralizada es una base de datos en la que los datos se almacenan y mantienen en una sola ubicación. Este es el enfoque tradicional para almacenar datos en grandes empresas. La base de datos distribuida es una base de datos en la que los datos se almacenan en dispositivos de almacenamiento que no están ubicados en la misma ubicación física, pero la base de datos se controla mediante un Sistema de administración de base de datos (DBMS) central.
¿Qué es la base de datos centralizada?
En una base de datos centralizada, todos los datos de una organización se almacenan en un solo lugar, como una computadora central o un servidor. Los usuarios en ubicaciones remotas acceden a los datos a través de la red de área amplia (WAN) utilizando los programas de aplicación proporcionados para acceder a los datos. La base de datos centralizada (el mainframe o el servidor) debería ser capaz de satisfacer todas las solicitudes que llegan al sistema, por lo que podría convertirse fácilmente en un cuello de botella. Pero dado que todos los datos residen en un solo lugar, es más fácil mantenerlos y realizar copias de seguridad de los mismos. Además, es más fácil mantener la integridad de los datos, porque una vez que los datos se almacenan en una base de datos centralizada, los datos obsoletos ya no están disponibles en otros lugares.
¿Qué es la base de datos distribuida?
En una base de datos distribuida, los datos se almacenan en dispositivos de almacenamiento que se encuentran en diferentes lugares físicos. No están conectados a una CPU común, pero la base de datos está controlada por un DBMS central. Los usuarios acceden a los datos en una base de datos distribuida accediendo a la WAN. Para mantener actualizada una base de datos distribuida, utiliza los procesos de replicación y duplicación. El proceso de replicación identifica cambios en la base de datos distribuida y aplica esos cambios para asegurarse de que todas las bases de datos distribuidas tengan el mismo aspecto. Dependiendo de la cantidad de bases de datos distribuidas, este proceso podría volverse muy complejo y lento. El proceso de duplicación identifica una base de datos como base de datos maestra y duplica esa base de datos. Este proceso no es tan complicado como el proceso de replicación, pero asegura que todas las bases de datos distribuidas tengan los mismos datos.
¿Cuál es la diferencia entre la base de datos distribuida y la base de datos centralizada?
Mientras que una base de datos centralizada mantiene sus datos en dispositivos de almacenamiento que están en una sola ubicación conectada a una sola CPU, un sistema de base de datos distribuida mantiene sus datos en dispositivos de almacenamiento que posiblemente estén ubicados en diferentes ubicaciones geográficas y se administran mediante un sistema central SGBD. Una base de datos centralizada es más fácil de mantener y mantener actualizada ya que todos los datos se almacenan en una sola ubicación. Además, es más fácil mantener la integridad de los datos y evitar el requisito de duplicación de datos. Pero, todas las solicitudes que llegan para acceder a los datos son procesadas por una sola entidad, como un solo mainframe, y por lo tanto, fácilmente podría convertirse en un cuello de botella. Pero con las bases de datos distribuidas, este cuello de botella se puede evitar ya que las bases de datos están paralelizadas haciendo que la carga se equilibre entre varios servidores. Pero mantener los datos actualizados en un sistema de base de datos distribuido requiere trabajo adicional, por lo tanto aumenta el costo de mantenimiento y la complejidad y también requiere software adicional para este propósito. Además, diseñar bases de datos para una base de datos distribuida es más complejo que el mismo para una base de datos centralizada.