Metodología del procesamiento de consultas distribuidas
Procesamiento de consultas distribuidas
Detienen acceso a datos de varios orígenes de datos heterogéneos.
Estos orígenes de datos pueden estar almacenados en el mismo equipo o en equipos diferentes.
El procesamiento de consultas tiene varias etapas a seguir para resolver una consulta SQL
Las características del modelo relacional permiten que cada motor de base de datos elija su propia representación que,comúnmente, resulta ser el álgebra relacional.
Existen varios medios para calcular la respuesta a una consulta.
En el caso del sistema centralizado,
El criterio principal para determinar el costo de una estrategia específica es el número de acceso al disco.
En un sistema distribuido es preciso tener en cuenta otros factores como son:
El costo de transmisión de datos en la red.
Repetición y fragmentación.
Procesamiento de intersección simple.
Arboles de consultas
Pasos:
Parsing y traducción de la consulta
Optimización
Generación de código
Ejecución de la consulta
Transformaciones equivalentes
Cuando una base de datos se encuentra en múltiples servidores ydistribuye a un número determinado de nodos tenemos:
El servidor recibe una petición de un nodo
El servidor es atacado por el acceso concurrente a la base de datos cargada localmente.
El servidor muestra un resultado y le da un hilo a cada una de las maquinas nodo de la red local.
Cuando una base de datos es acezada de esta manera la técnica que se utiliza es la de fragmentación de datos que puede ser híbrida, horizontal y vertical.
Existen diferentes algoritmos que pueden obtener transformaciones eficientes en el procesamiento de consultas.
Join en bucles (ciclos) anidados
Join en bucles anidados por bloques
Join por mezcla
Join por asociación.
Join por asociación híbrida
Join Complejos
Transact-SQL
Los proveedores OLE BD exponen datos en objetos tabulares denominados conjuntos de filas.
SQL Server permite hacer referencia a conjunto de filas desde OLE BD.
Es una extensión al SQL de Microsoft y Sybase.
Procesamiento de consultas
Es mucho más difícil en ambientes distribuidos que en centralizados, ya que existe un gran número de parámetros que afectan el rendimiento.
La función principal de un procesar es transformar una consulta en una especificación de alto nivel.
SQL Server
Proporciona características
Integration Services y PowerPivot
Pueden ayudar a integrar datos heterogéneos
Replicación de SQL Server
OLE BD
Microsoft SQL Server adminite consultas distribuidas utilizando OLE BD.
Es un enlace e incrustación de objetos para base de datos.
Es una tecnología usada para tener accesos a diferentes fuentes de información, o bases de datos, de manera uniforme.
Permite separar los datos de la aplicación que los requiere.
Se hizo así debido a que las aplicaciones requieren acceso de diferentes tipos y almacenes de datos.
Acceso a consultas distribuidas
Los usuarios pueden utilizar consultas distribuidas para obtener acceso a lo siguiente:
Datos distribuidos almacenados en varias estancias.
Datos heterogéneos almacenados en varios orígenes de datos relacionales y no relacionales.