Kategoriak: All - recuperación - fragmentación - transacción - datos

arabera Jesus Sosa 4 years ago

611

Bases de Datos Datos Distribuidas

La gestión de bases de datos distribuidas se enfoca en la organización y mantenimiento de datos que se encuentran repartidos entre diferentes nodos de una red, pudiendo estar localizados tanto en un entorno local como en diversas ubicaciones geográficas.

Bases de Datos Datos Distribuidas

Universidad Tecnológica de Izúcar de Matamoros De: Jesús Urid Sosa Cortés Fecha: 03-04-2020 Docente: Cupertino Lucero Álvarez Bases de datos para Cómputo en la Nube

Bases de Datos Datos Distribuidas

Un grupo de datos que pertenecen a un sistema pero a su vez esta reapartido entre ordenadores de una misma red, ya sea a nivel local o cada uno en una diferente localizacion geografica.

Ventajas y Desventajas
Las desventajas tienen: - En primer lugar los datos son localizados en lugar más cercano, por tanto, el acceso es más rápido, el procesamiento es rápido debido a que varios nodos intervienen en el procesamiento de una carga de trabajo. - Mediante la replicación de información, las bases de datos distribuidas pueden presentar cierto grado de tolerancia a fallos haciendo que el funcionamiento del sistema no dependa de un solo lugar como en el caso de las bases de datos centralizadas.
Las ventajas son: - En primer lugar los datos son localizados en lugar más cercano, por tanto, el acceso es más rápido. - Los datos se pueden colocar físicamente en el lugar donde se accedan más frecuentemente, haciendo que los usuarios tengan control local de los datos con los que interactúan. - El enfoque distribuido de las bases de datos se adapta más naturalmente a la estructura de las organizaciones. - La independencia de datos se puede dar en dos aspectos: lógica y física. -
Recuperación
- Fallo de las conexiones de comunicaciones El sistema debe ser capaz de tratar los posibles fallos que se produzcan en las comunicaciones entre nodos. El caso mas extremo es el que se produce cuando se divide la red.

- Catálogo: es el programa o conjunto de programas encargados de controlar la ejecución concurrente de las transacciones. - CM (Cache Manager). Tiene el subsistema que se encarga de mover los datos entre las memorias volátiles y no volátiles, en respuesta a las peticiones de los niveles más altos del sistema de bases de datos. - RM (Recovery Manager). Subsistema que asegura que la base de datos contenga los efectos de la ejecución de transacciones correctas y ninguno de incorrectas. - DM (Data Manager). Esto unifica las llamadas a los servicios del CM y el RM. - TM (Transaction Manager). Es un subsistema encargado de determinar que nodo deberá realizar cada operación a lo largo de una transacción.

- Fallo de los nodos. Cuando un nodo falla, el sistema deberá continuar trabajando con los nodos que aún funcionan. - Transacción distribuida correcta. Se pueden producir fallos durante la ejecución de una transacción correcta si se plantea el caso de que al acceder a alguno de los nodos que intervienen en la transacción. - Copias múltiples de fragmentos de datos. Es el encargado del control de concurrencia es el responsable de mantener la consistencia en todas las copias que se realicen y el subsistema que realiza la recuperación es el responsable de hacer copias consistentes de los datos de los nodos
Procesamiento Distribuido de Consultas
El procesamiento de consultas es de suma importancia en bases de datos centralizadas. Sin embargo, en BDD éste adquiere una relevancia mayor. El objetivo es convertir transacciones de usuario en instrucciones para manipulación de datos.

En BDD se tiene que considerar el procesamiento local de una consulta junto con el costo de transmisión de información al lugar en donde se solicitó la consulta.

Niveles de Transparencia en una Base de Datos Distribuida
El propósito de establecer una arquitectura de un sistema de bases de datos distribuidas es ofrecer un nivel de transparencia adecuado para el manejo de la información.

El sistema de bases de datos distribuido permite proporcionar independencia de los datos.

La transparencia al nivel de red se refiere a que los datos en un SBDD se accedan sobre una red de computadoras, sin embargo, las aplicaciones no deben notar su existencia.

La transparencia tiene como punto central la independencia de datos.

La responsabilidad sobre el manejo de transparencia debe estar compartida tanto por el sistema operativo, el sistema de manejo de bases de datos y el lenguaje de acceso a la base de datos distribuida.

La transparencia sobre replicación de datos se refiere a que si existen réplicas de objetos de la base de datos, su existencia debe ser controlada por el sistema no por el usuario.

La transparencia a nivel de fragmentación de datos permite que cuando los objetos de la bases de datos están fragmentados, el sistema tiene que manejar la conversión de consultas de usuario definidas sobre relaciones globales a consultas definidas sobre fragmentos.

2. Transparencia sobre el esquema de nombramiento. Lo anterior se logra proporcionando un nombre único a cada objeto en el sistema distribuido.

1. Transparencia sobre la localización de datos. El comando que se usa es independiente de la ubicación de los datos en la red y del lugar en donde la operación se lleve a cabo.

La independencia de datos se puede dar en dos aspectos

2. Independencia física de datos Se refiere al ocultamiento de los detalles sobre las estructuras de almacenamiento a las aplicaciones de usuario. la descripción física de datos puede cambiar sin afectar a las aplicaciones de usuario.

1. Independencia lógica de datos Se refiere a la inmunidad de las aplicaciones de usuario a los cambios en la estructura lógica de la base de datos.

Tipos de almacenamiento
1. Replica: es el sistema que conserva varias copias o réplicas idénticas de una tabla y cada réplica se almacena en un nodo diferente.

Incoveniente - Aumento de la sobrecarga en las actualizaciones: El sistema debe asegurar que todas las réplicas de la tabla sean consistentes

2. Fragmentación

3. Replica y Fragmentación

Son las técnicas de réplica y fragmentación se pueden aplicar sucesivamente a la misma relación de partida.

3 tipos de fragmentacion

- Fragmentación Horizontal: una tabla T se divide en subconjuntos, T1, T2, ...Tn. Los fragmentos se definen a través de una operación de selección y su reconstrucción se realizará con una operación de unión de los fragmentos componentes. - Fragmentación Vertical: cada fragmento debe incluir la clave primaria de la tabla. Su reconstrucción se realizará con una operación de join de los fragmentos componentes, pueden existir fragmentos no disjuntos: combinación de fragmentación y replicación. - Fragmentación Mixta: como el mismo nombre indica es una combinación de las dos anteriores vistas he aquí un ejemplo apartir de una tabla fragmentada horizontalmente.

Ventajas - Disponibilidad: este sistema sigue funcionando aún en caso de caída de uno de los nodos. - Aumento del paralelismo: hay nodos pueden realizar consultas en paralelo sobre la misma tabla.

Arquitectura de las Bases de Datos
Integra

Separación entre fragmentación y localización

- Transparencia de Fragmentación - Transparencia de Localización - Control explícito de redundancia - Independencia de BD locales

Fuciones

- Global Schema: que define todos los datos que están incluidos en la bd distribuida tal como si la bd no fuera distribuida. - Fragmentation Schema: es una relación global que puede consistir de varios fragmentos pero un fragmento está asociado con sólo una relación global. - Allocation Schema: define el sitio (o sitios) en el cual un fragmento está localizado. - Local Maping Schema: traduce los fragmentos locales a los objetos que son manejados por el SMBD local.

Integración lógica por medio de bottom-up (Multidatabase)

Integración lógica por medio de diseño top-down (DistDB)

Comparación
Centralizado

- Control centralizado: un solo DBA. - Independencia de Datos: organización de los datos es transparente para el programador. - Reducción de redundancia: una sola copia de datos que se comparta. - Estructuras físicas complejas para accesos eficientes - Seguridad

Distribuido

- Control jerárquico: DBA global y DBA local. - Transparencia en la Distribución: localización de los datos es un aspecto adicional de independencia de datos. - Replicación de Datos: Copias múltiples de datos que incrementa la localidad y la disponibilidad de datos. - Uso de optimización global para reducir transferencia de datos. - Problemas de seguridad intrínsecos