Evolución y características del modelado de datos
Concepto de modelado de datos, importancia y componentes básicos.
Concepto: El modelado de datos es el proceso de registrar el diseño de sistemas de software complejos a diagramas fáciles de entender. Este proceso utiliza texto y símbolos para indicar la forma en que los datos deben fluir. (Vergara, 2020).
Importancia: Ayuda a crear una base de datos lógica simplificada que elimina la redundancia, reduce los requisitos de almacenamiento y permite una recuperación eficiente. También equipa a todos los sistemas con una "única fuente de verdad" que es esencial para operaciones eficaces y cumplimiento regulatorio. (SAP, s/f).
Componentes del modelado de datos
Orígenes de datos:
Los orígenes de datos son elementos de un modelo de datos que representan orígenes de datos reales del entorno del usuario.
Tipos de datos:
Los tipos de datos son elementos de un modelo de datos que representan conjuntos de datos almacenados en un origen de datos.
Elementos de datos:
Los elementos de datos son elementos del modelo de datos que representan unidades de datos reales almacenadas en un origen de datos.
Enlaces:
Los enlaces son elementos del modelo de datos que definen relaciones entre tipos de datos y elementos de datos.
Orígenes de sucesos:
Los orígenes de sucesos son tipos especiales de orígenes de datos. Cada origen de sucesos representa una aplicación que almacena y gestiona sucesos. (IBM, 2021).
Diferencias entre el modelo de datos y el modelado de datos.
Modelo de datos: Este modelo muestra la estructura lógica de la base, incluidas las relaciones y limitaciones que determinan cómo se almacenan los datos y cómo se accede a ellos. Los modelos de bases de datos individuales se diseñan en base a las reglas y los conceptos de cualquier modelo de datos más amplio que los diseñadores adopten.
Modelado de datos: Es el proceso de creación de una representación visual o esquema que define los sistemas de recopilación y administración de información. Permite crear una vista unificada de los datos de una entidad, por lo que el modelo esboza los datos que recoge dicha entidad, la relación entre los distintos conjuntos de datos y los métodos que se usarán para almacenarlos y analizarlos.
Diferencias: El modelo de datos proporciona un método para comunicar visualmente los datos que una organización necesita, recopila y utiliza. Mientras que en el modelado de datos se presentan las herramientas de las representaciones visuales del modelo de datos y es la base del desarrollo del software, así como todo lo relacionado con las bases de datos.
Principales hitos en la evolución de los modelos de datos
1945: Shellmar, produjo las primeras cintas para la grabadora Soundmirror BK 401 y la grabadora Mail-A-Voice de disco.
1957: Se realiza la instalación de la primer computadora comercial.
1959: MC Gee propone el concepto de acceso generalizado a datos almacenados electrónicamente.
1959: IBM presenta el sistema RAMAC.
1961: Bachman diseña el primer SGDB generalizado.
1961: Se implementa el modelo jerárquico de datos.
1962: Se implementa el modelo de datos en red.
1970: Creación del modelo de datos de fichero invertido.
1971: Se implementa el modelo realcional de datos.
1972: Creación del modelo de datos dimensiona.
1973: Creación del modelo de datos de grafo.
1975: Se organiza la primera conferencia internacional de "SIGMOD" y "VLDB".
1976: Chen introduce el modelo ER.
1980: Se implementa el modelo de datos multivaluiado.
1985: Se publica la primera norma preliminar de SQL.
Modelo relacional en el modelado de datos, características principales y funciones
Una base de datos relacional es un tipo de base de datos que almacena y proporciona acceso a puntos de datos relacionados entre sí. Estas B.D. se basan en el modelo relacional, una forma intuitiva y directa de representar datos en tablas. En esta B.D., cada fila en una tabla es un registro con una ID única, llamada clave. Las columnas de la tabla contienen los atributos de los datos y cada registro suele tener un valor para cada atributo, lo que simplifica la creación de relaciones entre los puntos de datos.
Características:
Una base de datos relacional es una colección de información que organiza datos en relaciones predefinidas, por lo que se enlistan sus principales características:
* Los datos son atómicos o mono valuados.
* Los datos de cualquier columna son de un solo tipo
* Cada columna posee un nombre único
* El orden de las columnas no es de importancia para la tabla.
* Las columnas de una relación se conocen como atributos
* Cada atributo tiene un dominio
* No existen 2 filas en la tabla que sean idénticas.
* La Información en las bases de datos son representados como datos explícitos
* Cada relación tiene un nombre especifico y diferente al resto de las relaciones.
* Los valores de los atributos son atómicos: en cada tupla, cada atributo (columna) toma un solo valor se dice que las relaciones están normalizadas.
* El orden de los atributos no importa: lo atributos no están ordenados.
* Cada tupla es distinta de las demás: no hay tuplas duplicadas.
* El orden de las tuplas no importa: las tuplas no están ordenadas.
* Los atributos son atómicos: en cada tupla, cada atributo (columna) toma un solo valor. Se dice que las relaciones están normalizadas.
Principales funciones:
Este modelo de datos tiene la capacidad de establecer vínculos (o relaciones) entre información mediante la unión de tablas, lo que facilita la comprensión y la obtención de estadísticas sobre la relación entre varios datos. A continuación se enlistan sus principales funciones:
* Almacenar datos
* Editar datos
* Borrar datos
* Gestionar los metadatos
* Seguridad de los datos
* Integridad de los datos
* Función multiusuario
* Optimizar las consultas
* Trigger and stored produres
* Transferencia del sistema
DBMS propietarios y libres
DBMS Propietarios: La Free Software Foundation (FSF Fundación de Software Libre), fundada en 1985, define al software propietario como aquel que no es libre. Su uso, redistribución omodificación está prohibida, y/o requiere una autorización y es de dominio privado, porque una determinadapersona tiene la titularidad de los derechos de autor y goza de un derecho exclusivo respecto de su utilización. A continuación se enlistan tres DBMS propietarios:
FileMaker Pro
IBM Informix on Cloud
Microsoft SQL Server
DBMS Libres: Este software respeta la libertad de los usuarios y la comunidad, ofreciendo la libertad de ejecutar, copiar, distribuir, estudiar, modificar y mejorar el software como sea conveniente a lo largo del tiempo y sin restricción alguna al contrario de lo que es el software de propietarios. A continuación se enlistan tres DBMS libres:
Firebird
Sqlite
Postgre SQL
Opinión personal al elegir un DBMS, enlistando y definiendo cuáles son los factores más importantes a considerar.
Para aprovechar al máximo un DBMS, tenemos que considerar los siguientes puntos:
* Usabilidad
* Seguridad
* Funcionalidad
* Soporte y desarrollo
* Escalabilidad
* Costo e idoneidad
Dicho lo anterior, se puede decir que la elección va de acuerdo a las necesidades del usuario, ya que en base a dichas necesidades y requerimientos, se utilizará el DBMS que cuente con las herramientas para su correcta implemetación y desarrollo en el entorno previamente establecido.
Otra forma de valorar un DBMS correcto sería analizando los siguientes puntos:
* Número de usuarios
* Número de transacciones
* Cantidad de datos para almacenar
* Consistencia de la información
* Experiencia propia o externa
* Que sistema operativo se implemetará
Con estos puntos podemos ver a más a fondo el DBMS que se necesita según los requerimientos del usuario, por lo que también el mismo deberá compilar y analizar estadísticas relativas al rendimiento del sistema e identificar áreas potenciales del problema para no contar con áreas de oportunidad en la implemetación de la B.D., así como el sistema operativo donde se implemetará y no tener inconvenientes con la compatibilidad entre plataformas.