Metodología del procesamiento de consultas distribuidas

r

Materia: Bases de datos distribuidasProfesora: Estela Martínez CruzGrupo: 5751Alumna: Reyes Ortega Lizet

Procesamiento de consultas distribuidas

Detienen acceso a datos de varios orígenes de datos heterogéneos.

Estos orígenes de datos pueden estar almacenados en el mismo equipo o en equipos diferentes.

El procesamiento de consultas tiene varias etapas a seguir para resolver una consulta SQL

Las características del modelo relacional permiten que cada motor de base de datos elija su propia representación que,comúnmente, resulta ser el álgebra relacional.

Existen varios medios para calcular la respuesta a una consulta.

En el caso del sistema centralizado,

El criterio principal para determinar el costo de una estrategia específica es el número de acceso al disco.

En un sistema distribuido es preciso tener en cuenta otros factores como son:

El costo de transmisión de datos en la red.

Repetición y fragmentación.

Procesamiento de intersección simple.

Arboles de consultas

Arboles de consultas

Pasos:

Parsing y traducción de la consulta

Optimización

Generación de código

Ejecución de la consulta

Transformaciones equivalentes

Transformaciones equivalentes

Cuando una base de datos se encuentra en múltiples servidores ydistribuye a un número determinado de nodos tenemos:

El servidor recibe una petición de un nodo

El servidor es atacado por el acceso concurrente a la base de datos cargada localmente.

El servidor muestra un resultado y le da un hilo a cada una de las maquinas nodo de la red local.

Cuando una base de datos es acezada de esta manera la técnica que se utiliza es la de fragmentación de datos que puede ser híbrida, horizontal y vertical.

Existen diferentes algoritmos que pueden obtener transformaciones eficientes en el procesamiento de consultas.

Join en bucles (ciclos) anidados

Join en bucles anidados por bloques

Join por mezcla

Join por asociación.

Join por asociación híbrida

Join Complejos

Transact-SQL

Los proveedores OLE BD exponen datos en objetos tabulares denominados conjuntos de filas.

SQL Server permite hacer referencia a conjunto de filas desde OLE BD.

Es una extensión al SQL de Microsoft y Sybase.

Procesamiento de consultas

Es mucho más difícil en ambientes distribuidos que en centralizados, ya que existe un gran número de parámetros que afectan el rendimiento.

La función principal de un procesar es transformar una consulta en una especificación de alto nivel.

SQL Server

Proporciona características

Integration Services y PowerPivot

Pueden ayudar a integrar datos heterogéneos

Replicación de SQL Server

OLE BD

Microsoft SQL Server adminite consultas distribuidas utilizando OLE BD.

Es un enlace e incrustación de objetos para base de datos.

Es una tecnología usada para tener accesos a diferentes fuentes de información, o bases de datos, de manera uniforme.

Permite separar los datos de la aplicación que los requiere.

Se hizo así debido a que las aplicaciones requieren acceso de diferentes tipos y almacenes de datos.

Acceso a consultas distribuidas

Los usuarios pueden utilizar consultas distribuidas para obtener acceso a lo siguiente:

Datos distribuidos almacenados en varias estancias.

Datos heterogéneos almacenados en varios orígenes de datos relacionales y no relacionales.