ESQUEMAS DE REPLICACIÓN.
DEFINICIÓN.
En una base de datos distribuidas.
Determina cuantas replicas.
De datos son creadas y a que procesador son asignadas.
DISTRIBUCIÓN DE DATOS.
En un sistema gestor de base de datos.
Establece como cada fragmento .
Asignarlo a un sitio determinado.
define para cada nodo el conjunto de datos que
que va a
administrar.
o controlar localmente.
realiza en forma estática al momento del diseño o de la ampliación de la red.
No interviene la performance real del sistema.
SIN REDUNDANCIA DE DATOS.
Estos modelos no soportan replicación.
cada fragmento reside en un solo sitio.
Incluyen el modelo.
Centralizado.
Particionado.
MODELO CENTRALIZADO.
no involucra distribución de datos.
Los datos están almacenados en un simple manejador de recursos.
El uso de los datos puede ser distribuido
vía acceso.
Local.
Remoto.
Los datos están siempre consistentes y actualizados.
Esta estrategia tiene el efecto de minimizar los costos de almacenamiento.
La falta de distribución hace el control, la seguridad, y el mantenimiento muy simple.
El procesamiento de consultas se simplifica en los sitios remotos.
Tener en cuenta son los altos costos de los accesos remotos en términos.
De demoras de comunicación y contención.
MODELO PARTICIONADO.
Utiliza la noción de tener una sola copia de la BD como en el caso centralizado.
Pero distribuye las partes de ella en los deferentes sitios.
Las actualizaciones serán más baratas y rápidas que los casos centralizado.
Minimiza el volumen de almacenamiento
porque existe una sola copia.
La confiabilidad es mas alta que en la versión centralizada,pero menos que en la replicada.
CON REDUNDANCIA DE DATOS.
soportan replicación, e incluyen los modelos totalmente replicados o
parcialmente replicados.
MODELO TOTALMENTE REPLICADO.
Es el caso extremo de los diferentes grados de replicación.
Se replica toda la BD en todos los sitios del sistema distribuido.
El mayor beneficio es para los usuarios finales en términos de confiabilidad aumentada
debido a las múltiples.
Copias y tiempo de respuesta reducido para las consultas.
El costo de las consultas se minimiza porque no hay overhead por comunicaciones.
Posee el costo mas alto asociado con el hardware debido a
las N copias (si hay N sitios).
MODELO PARCIALMENTE REPLICADO.
Se permite que la BD tenga cualquier
combinación de los tres modelos previos.
Representa la selección de las mejores características de los anteriores
minimizando los efectos de las porciones.
COMPARACIÓN DE LOS DIFERENTES GRADOS DE REPLICACIÓN.
Se comparan la complejidad de implementar o tomar ventaja de las diferentes alternativas de replicación.
Si los datos están totalmente replicados, el procesamiento de consultas va a ser fácil.
ESQUEMAS ESTATICOS.
Se diseña la base de datos distribuida, y permanece hasta que el diseñador intervenga manualmente.
Para cambiar el número de réplicas o su localización.
ESQUEMAS DINAMICOS.
De acuerdo a las variaciones del patrón de acceso
y carga del sistema.
Cambian dinámicamente el esquema de replicación de un dato.
Creaciones de nuevas réplicas.
Eliminaciones de réplicas.
ALGORITMOS CENTRALIZADOS VS DINAMICOS.
Algoritmos centralizados.
transmite periódicamente la información
pertinente (normalmente estadísticas) hacia algún procesador predeterminado x.
x computa la función y ordena el cambio del esquema de replicación.
Algoritmos distribuidos.
Cada procesador toma decisiones para cambiar localmente el esquema de replicación.
Responden a cambios en el modelo de lectura-escritura de una manera más oportuna, ellos evitan el retraso involucrado.
Su sobrecarga es menor porque ellos eliminan los mensajes extras requeridos en el
caso centralizado.
AMBIENTES MOVILES.
Las máquinas desconectadas o pobremente conectadas dependen
principalmente de los recursos locales.
Los host móviles deben enfrentar una
reducida disponibilidad, una medida apropiada para tener datos es almacenarlos localmente.
La replicación es necesaria cuando un usuario móvil frecuentemente
accede a datos que son poco actualizados.
La alocación de una copia de tal dato a un
usuario móvil puede reducir costos involucrados en tales transacciones.
ESQUEMA IDEAL.
La elección de sitios y el grado de replicación dependen de los objetivos de rendimiento y
disponibilidad para el sistema y de los tipos y secuencias de transacciones introducidas en cada sitio.
un esquema de replicación óptimo depende del patrón de
acceso, es decir, el número de lecturas y escrituras emitidas por cada procesad.