Que a diferencia
Que a diferencia
Contiene el entorno distribuido con los siguientes elementos
Hay
En los entornos distribuidos de datos como:
Y
Lo que da
Que es
Y
También existe
También existe
Son
Son
La
La
Clasifica
Clasifica
Que
Que trata
Que son
Existen
Sus
Sus
Que estructura
Como
La
Unas
La
La
Incorpora
Incorpora
Como
como
También hay
Hace
Hace
Que construye
Compone
Forma
Tiene
Son

Bases de Datos Datos Distribuidas

Un grupo de datos que pertenecen a un sistema pero a su vez esta reapartido entre ordenadores de una misma red, ya sea a nivel local o cada uno en una diferente localizacion geografica.

Comparación

Distribuido

- Control jerárquico:
DBA global y DBA local.
- Transparencia en la Distribución:
localización de los datos es un aspecto adicional de independencia de datos. - Replicación de Datos: Copias múltiples de datos que incrementa la localidad y la disponibilidad de datos. - Uso de optimización global para reducir transferencia de datos. - Problemas de seguridad intrínsecos

Centralizado

- Control centralizado: un solo DBA. - Independencia de Datos:
organización de los datos es transparente para el programador. - Reducción de redundancia:
una sola copia de datos que se comparta. - Estructuras físicas complejas para accesos eficientes - Seguridad

Arquitectura de las Bases de Datos

Integra

Integración lógica por medio de diseño top-down (DistDB)

Integración lógica por medio de bottom-up (Multidatabase)

Fuciones

- Global Schema: que define todos los datos que están incluidos en la bd distribuida tal como si la bd no fuera distribuida. - Fragmentation Schema: es una relación global que puede consistir de varios fragmentos pero un fragmento está asociado con sólo una relación global. - Allocation Schema: define el sitio (o sitios) en el cual un fragmento está localizado. - Local Maping Schema: traduce los fragmentos locales a los objetos que son manejados por el SMBD local.

Separación entre fragmentación y localización

- Transparencia de Fragmentación - Transparencia de Localización - Control explícito de redundancia - Independencia de BD locales

Tipos de almacenamiento

1. Replica: es el sistema que conserva varias copias o réplicas idénticas de una tabla y cada réplica se almacena en un nodo diferente.

Ventajas - Disponibilidad: este sistema sigue funcionando aún en caso de caída de uno de los nodos. - Aumento del paralelismo: hay nodos pueden realizar consultas en paralelo sobre la misma tabla.

2. Fragmentación

3 tipos de fragmentacion

- Fragmentación Horizontal: una tabla T se divide en subconjuntos, T1, T2, ...Tn. Los fragmentos se definen a través de una operación de selección y su reconstrucción se realizará con una operación de unión de los fragmentos componentes. - Fragmentación Vertical: cada fragmento debe incluir la clave primaria de la tabla. Su reconstrucción se realizará con una operación de join de los fragmentos componentes, pueden existir fragmentos no disjuntos: combinación de fragmentación y replicación. - Fragmentación Mixta: como el mismo nombre indica es una combinación de las dos anteriores vistas he aquí un ejemplo apartir de una tabla fragmentada horizontalmente.

3. Replica y Fragmentación

Son las técnicas de réplica y fragmentación se pueden aplicar sucesivamente a la misma relación de partida.

Incoveniente - Aumento de la sobrecarga en las actualizaciones: El sistema debe asegurar que todas las réplicas de la tabla sean consistentes

Niveles de Transparencia en una Base de Datos Distribuida

El propósito de establecer una arquitectura de un sistema de bases de datos distribuidas es ofrecer un nivel de transparencia adecuado para el manejo de la información.

El sistema de bases de datos distribuido permite proporcionar independencia de los datos.

La independencia de datos se puede dar en dos aspectos

1. Independencia lógica de datos Se refiere a la inmunidad de las aplicaciones de usuario a los cambios en la estructura lógica de la base de datos.

2. Independencia física de datos Se refiere al ocultamiento de los detalles sobre las estructuras de almacenamiento a las aplicaciones de usuario. la descripción física de datos puede cambiar sin afectar a las aplicaciones de usuario.

La transparencia al nivel de red se refiere a que los datos en un SBDD se accedan sobre una red de computadoras, sin embargo, las aplicaciones no deben notar su existencia.

1. Transparencia sobre la localización de datos. El comando que se usa es independiente de la ubicación de los datos en la red y del lugar en donde la operación se lleve a cabo.

2. Transparencia sobre el esquema de nombramiento. Lo anterior se logra proporcionando un nombre único a cada objeto en el sistema distribuido.

La transparencia sobre replicación de datos se refiere a que si existen réplicas de objetos de la base de datos, su existencia debe ser controlada por el sistema no por el usuario.

La transparencia a nivel de fragmentación de datos permite que cuando los objetos de la bases de datos están fragmentados, el sistema tiene que manejar la conversión de consultas de usuario definidas sobre relaciones globales a consultas definidas sobre fragmentos.

La transparencia tiene como punto central la independencia de datos.

La responsabilidad sobre el manejo de transparencia debe estar compartida tanto por el sistema operativo, el sistema de manejo de bases de datos y el lenguaje de acceso a la base de datos distribuida.

Procesamiento Distribuido de Consultas

El procesamiento de consultas es de suma importancia en bases de datos centralizadas. Sin embargo, en BDD éste adquiere una relevancia mayor. El objetivo es convertir transacciones de usuario en instrucciones para manipulación de datos.

En BDD se tiene que considerar el procesamiento local de una consulta junto con el costo de transmisión de información al lugar en donde se solicitó la consulta.

Recuperación

- Fallo de los nodos. Cuando un nodo falla, el sistema deberá continuar trabajando con los nodos que aún funcionan. - Transacción distribuida correcta. Se pueden producir fallos durante la ejecución de una transacción correcta si se plantea el caso de que al acceder a alguno de los nodos que intervienen en la transacción. - Copias múltiples de fragmentos de datos. Es el encargado del control de concurrencia es el responsable de mantener la consistencia en todas las copias que se realicen y el subsistema que realiza la recuperación es el responsable de hacer copias consistentes de los datos de los nodos

- Fallo de las conexiones de comunicaciones El sistema debe ser capaz de tratar los posibles fallos que se produzcan en las comunicaciones entre nodos. El caso mas extremo es el que se produce cuando se divide la red.

- Catálogo: es el programa o conjunto de programas encargados de controlar la ejecución concurrente de las transacciones. - CM (Cache Manager). Tiene el subsistema que se encarga de mover los datos entre las memorias volátiles y no volátiles, en respuesta a las peticiones de los niveles más altos del sistema de bases de datos. - RM (Recovery Manager). Subsistema que asegura que la base de datos contenga los efectos de la ejecución de transacciones correctas y ninguno de incorrectas. - DM (Data Manager). Esto unifica las llamadas a los servicios del CM y el RM. - TM (Transaction Manager). Es un subsistema encargado de determinar que nodo deberá realizar cada operación a lo largo de una transacción.

Ventajas y Desventajas

Las ventajas son: - En primer lugar los datos son localizados en lugar más cercano, por tanto, el acceso es más rápido. - Los datos se pueden colocar físicamente en el lugar donde se accedan más frecuentemente, haciendo que los usuarios tengan control local de los datos con los que interactúan. - El enfoque distribuido de las bases de datos se adapta más naturalmente a la estructura de las organizaciones. - La independencia de datos se puede dar en dos aspectos: lógica y física. -

Las desventajas tienen: - En primer lugar los datos son localizados en lugar más cercano, por tanto, el acceso es más rápido, el procesamiento es rápido debido a que varios nodos intervienen en el procesamiento de una carga de trabajo. - Mediante la replicación de información, las bases de datos distribuidas pueden presentar cierto grado de tolerancia a fallos haciendo que el funcionamiento del sistema no dependa de un solo lugar como en el caso de las bases de datos centralizadas.

Universidad Tecnológica de Izúcar de Matamoros
De: Jesús Urid Sosa Cortés
Fecha: 03-04-2020
Docente: Cupertino Lucero Álvarez
Bases de datos para Cómputo en la Nube