sábado, 1 de febrero de 2014

Fragmentacion de Tablas

FRAGMENTACION DE TABLAS DISTRIBUIDAS

Es una relación que corresponde a una tabla, consiste en dividirla en fragmentos  menores, cada fragmento se guarda en sitio diferente, tiene como objetivo buscar  al ternativas para dividir una las tablas o instancias en otras más pequeñas
Para ello hay las siguientes alternativas lógicas, como son:
La fragmentación se puede realizar por tuplas individuales (fragmentación horizontal), por atributos individuales fragmentación vertical) o una combinación de ambas (fragmentación híbrida).

RAZONES PARA FRAGMENTAR

  • Encontrar unidad de distribución más adecuada.
  • Disminuir cantidad de accesos remotos
  • Incrementar el nivel de concurrencia


VENTAJAS DE LA FRAGMENTACIÓN DE TABLAS

  • Mejorar el rendimiento de las aplicaciones al trabajar con subconjuntos de relaciones.
  • Da una respuesta eficiente a aplicaciones que trabajan con los mismos datos en diferentes nodo.
  • Los fragmentos permiten aumentar el número de ejecucionesconcurrentes.

 
DESVENTAJAS DE LA FRAGMENTACIÓN DE TABLAS

  • Disminuye la eficiencia en las aplicaciones que trabajan con varios fragmentos. 
  • La comprobación de las restricciones de integridad puede ser más costosa

 MÉTODOS DE FRAGMENTACIÓN

Las relaciones se almacenan a través de varios sitios de una red de computadoras. Acceder a una relación que esta almacenada en un sitio remoto incurre en costos de comunicación (costos de transferencia o transporte), para reducir estos costos, una relación puede fragmentarse a través de varios sitios, y los fragmentos pueden almacenarse en los sitios donde se acceden con mayor frecuencia.
La fragmentación es una técnica de diseño para dividir una relación de una base de datos en dos o más particiones de tal forma que la combinación de las particiones produzca la relación original sin ninguna pérdida o adición de información El problema de la fragmentación de datos apareció antes de las bases de datos distribuidas, incluso antes del surgimiento de las bases de datos, para reducir los costos de almacenamiento y de transferencia en los sistemas de archivos. Los primeros trabajos relacionados con la fragmentación en bases de datos distribuidas son. Conel surgimiento del modelo de datos orientado a objetos, las propuestas de fragmentación existentes se adoptaron en el modelo de datos orientado a objetos, tomando en conside-ración las características de dicho modelo. La fragmentación de datos permite la ejecución paralela de una consulta simple, reduce la cantidad de accesos a datos irrelevantes y la transferencia de datos innecesaria, incrementa el nivel de concurrencia y, por lo tanto, la capacidad de procesamiento en un sistema distribuido de bases de datos.


 Fragmentación Vertical




Ejemplo de fragmentación vertical
Los fragmentos de la Figura  pueden definirse de la siguiente forma:
EQUIPO1=ID,NOMBRE,MCA,MOD,CAB(EQUIPO)
EQUIPO2=ID,PRECIO,CANT(EQUIPO)
El objetivo de la fragmentación vertical es dividir una relación en un conjunto de relaciones más pequeñas para que muchas de las consultas se ejecuten en sólo un fragmento.
En este contexto, una fragmentación "óptima" es aquella que produce un esquema de fragmentación que minimice el tiempo de ejecución de las consultas que accedan atributos de esos fragmentos.
Una formulación general del problema de fragmentación vertical es el siguiente: Dada una relación R formada por un conjunto de atributos
R ={a1, ..., an} y un conjunto de consultas Q={q1,...,qm} determinar un esquema de fragmentación vertical formado por conjunto de fragmentos
EFV={fr1,...,frp} tal que:

  • Cada fragmento fr EFV almacene un subconjunto de los atributos de R más la clave primaria de R.
  • Cada atributo aR, se encuentre en exactamente un fragmento fr FV, con excepción de la clave primaria.
  • Minimice la suma de los costos de las consultas cuando se ejecutan en un esquema.
  • Métodos de fragmentación de fragmentación vertical qQCosto(q,EFV).
  • La fragmentación vertical se ha investigado en el contexto de sistemas centralizados de base de datos, así como en los distribuidos. Su motivación en el contexto centralizado es que es una herramienta de diseño, que permite a las consultas tratar con relaciones más pequeñas, y esto causa un menor número de accesos a páginas

No hay comentarios:

Publicar un comentario