METODOLOGÍA HEFESTO
PASO 1) ANÁLISIS DE REQUERIMIENTOS
Identificar los requerimientos de los usuarios a través de preguntas.
Identificar cuáles serán los Indicadores y Perspectivas.
Finalmente se confeccionará un Modelo Conceptual en donde se podrá visualizar el resultado obtenido.
Ejemplo
Los requerimiento consta de dos Data Marts, deberá aplicarse la metodología dos veces, una por cada Data Mart.
Área de” Ventas” y” Compras”
Se deberá aplicar la metodología al área de Ventas y Compras de forma independiente.
1.1) PREGUNTAS DE NEGOCIO
Acopio de las necesidades de información
Área de” Ventas” y” Compras”
Características inherentes y específicas
Ejemplo
entrevistas, cuestionarios, observaciones, etc.
Guiar la investigación hacia un desarrollo
El objetivo principal de esta fase
Obtener e identificar las necesidades de información clave de alto nivel
Ejecutar las estrategias de la empresa
Desarrollar los pasos sucesivos
Asegurarse de un buen análisis
CASO PRÁCTICO
En las primeras entrevistas se indagó a los usuarios en busca de sus necesidades de información, pero las mismas abarcaban casi todas las actividades de la empresa, por lo cual se les pidió que escogieran el proceso que considerasen más importante en las actividades diarias de la misma y que estuviese soportado de alguna manera por algún Data Source.
El proceso elegido fue el de Ventas.
Cuáles es su criterio,
Indicadores más representativos del proceso de Ventas
Cuál es el análisis que se desea realizar
Las Preguntas de Negocio obtenidas fueron las siguiente
Unidades vendidas de cada producto a cada cliente en un tiempo determinado.
Monto total de ventas de cada producto a cada cliente en un tiempo determinado.
1.2) INDICADORES Y PERSPECTIVAS
Descubrir los Indicadores que se utilizarán y las Perspectivas de análisis que intervendrán.
INDICADORES
Son valores numéricos y representan lo que se desea analizar
PERSPEPTIVAS
Se refieren a las entidades mediante los cuales se quieren examinar los Indicadores, con el fin de responder a las preguntas planteadas.
EJEMPLO
Clientes, proveedores, sucursales, países, productos, rubros, etc.
1.3) MODELO CONCEPTUAL
Es una descripción de alto nivel de la estructura de la base de datos
Representada a través de
Objetos
Relaciones
Atributos.
REPRESENTACIÓN GRAFICA
IZQUIERDA
Se colocan las Perspectivas seleccionadas
ÓVALO CENTRAL
Representa y lleva el nombre de la Relación que existe entre ellas
DERECHA
Los Indicadores
CASO PRÁCTICO
PASO 2) ANÁLISIS DE DATA SOURCES
Determina cómo serán calculados los Indicadores para establecer el mapeo.
Se definirán qué campos se incluirán en cada Perspectiva.
Se ampliará el modelo conceptual con la información obtenida en este paso
2.1) HECHOS E INDICADORES
Hecho/s que lo componen
Fórmula de cálculo
Hecho1 + Hecho2
Función de agregación
Se utiliza
SUM, AVG, COUNT, etc.
CASO PRÁCTICO
Indicador=
Unidades Vendidas
o Hechos: Unidades Vendidas
o Función de agregación: SUM
Monto Total de Ventas
o Hechos: (Unidades Vendidas) * (Precio de Venta)
o Función de agregación: SUM
2.2) MAPEO
Examina los Data Sources e identifica sus características propias
Los Data Sources disponibles contengan los datos requeridos.
CASO PRÁCTICO
En el Data Source de la empresa analizada, el proceso de venta .
Representado por
Diagrama de Entidad Relación
Cardinalidades
Claves
Atributos
Jerarquías de generalización
• La Perspectiva Productos
Se relaciona con tabla Productos
• La Perspectiva Clientes
Se relaciona con la tabla Clientes
Mapeo entre los dos Modelos
• La Perspectiva Tiempo
Se relaciona con el campo fecha de la tabla Facturas_Venta.
Campos posibles
Día de la semana
Quincena
Mes
Trimestre
Semestre
Año
2.3) GRANULARIDAD
Establecido el Mapeo con los Data Sources
Se deben seleccionar los campos
Contendrá
Perspectiva
Indicadores
2.4) MODELO CONCEPTUAL AMPLIADO
Gaficar los resultados obtenidos en los pasos anteriores
Se ampliará el Modelo Conceptual
Colocando debajo de cada Perspectiva los campos seleccionados
Debajo de cada Indicador su respectiva fórmula de cálculo.
CASO PRÁCTICO
PASO 3) MODELO LÓGICO DEL DW
Estructurado del DW, teniendo como base el Modelo Conceptual que ya ha sido creado.
Representación de una estructura de datos
3.1) TIPOLOGÍA
Mejor se adapte a los requerimientos y necesidades de los usuarios
Empleará
Esquema en Estrella
Esquema en Copo de Nieve
Esquema en Constelación
3.2) Tablas de Dimensiones
Proceso
Se elegirá un nombre que identifique la tabla de Dimensión
Se añadirá un campo que represente su clave principal
Se redefinirán los nombres de los campos
Gráficamente
Esquemas Copo de nieve
Cuando existan Jerarquías dentro de una tabla de Dimensión, esta tabla deberá ser normalizada
Ejemplo
Como referencia la siguiente tabla de Dimensión y su respectivas relaciones padre-hijo entre sus campos
Obtendrá
CASO PRÁCTICO
Perspectiva Clientes
Perspectiva Productos
Perspectiva Tiempo
3.3) Tablas de Hechos
Esquemas en Estrella y Copo de Nieve
Asignar un nombre a la tabla de Hechos que represente la información
Contiene
Área de investigación
Negocio enfocado
Definirá su clave primaria
Se crearán tantos campos de Hechos como Indicadores
Esquemas Constelación
Las tablas de Hechos se deben confeccionar teniendo en cuenta el análisis de las preguntas
Cada tabla de Hechos debe poseer un nombre que la identifique y su clave
Caso 1:
Entonces se obtendrá
CASO PRÁCTICO
3.4) Uniones
Para los tres tipos de Esquemas
Uniones correspondientes entre sus tablas de Dimensiones
Tablas de Hechos
CASO PRÁCTICO
RELACIÓN DE LAS METAS DE LA ORGANIZACIÓN CON LAS DEL DWH
El DWH coincide con las metas
necesita mejorar su eficiencia en la toma de decisiones
Cuenta con información detallada a tal fin
Procura una mayor ventaja competitiva
PRINCIPALES VENTAJAS E INCONVENIENTES
Soportará la estrategia de la empresa.
Permitirá a los usuarios tener una visión general del negocio
Transformará datos operativos en información analítica, enfocada a la toma de decisiones.
Se podrán generar reportes dinámicos, ya que actualmente son estáticos y no ofrecen ninguna facilidad de análisis.
Aportará a la mejora continua de la estructura de la empresa.
PROCESOS
VENTAS
o Minorista
Realiza a Los clientes particulares que se acercan hasta la empresa para adquirir los productos que requieren.
o Mayorista
Efectúan a los grandes clientes, ya sea por medio de comunicaciones telefónicas, o a través de visitas o reuniones.
COMPRAS
El departamento de Compras, al recibir del departamento de Depósito las necesidades de mercadería,
realiza una comparación de los productos ofrecidos
OBJETIVO
Facilitar el arduo trabajo para construir un Data Warehouse desde cero
Orientada a
Amortiguar el tedio que provoca seguir pasos sin comprender el porqué de su ejecución.
INTRODUCCIÓN
Fundamentada en una extensa investigación
Aporta experiencias propias en procesos de diseño e implementación de DW.
Los feedbacks que han aportado quienes han utilizado esta metodología en diversos países.
Se adapta muy bien a cualquier ciclo de vida de desarrollo de software.
CARACTERÍSTICAS
Utiliza modelos conceptuales y lógicos
Son sencillos de interpretar y analizar.
Es independiente del software/hardware
facilidad y rapidez a los cambios del negocio.
Se aplica en Data Warehouse y en Data Mart.
Los objetivos y resultados esperados en cada fase
Culmina con una fase, obteniendo entrada de la fase siguiente.
EMPRESA ANALIZADA
Describir las características principales
Realizar un análisis que ayudará a conocer el funcionamiento y accionar la empresa
examinar e interpretar de forma óptima las necesidades
IDENTIFICACIÓN DE LA EMPRESA
Ambiente geográfico
Alcance nacional.
Su volumen de operaciones, se la puede considerar de tamaño mediano.
Desarrolla las actividades comerciales de mayorista y minorista de artículos de limpieza
OBJETIVOS
Maximizar sus ganancias
Expandirse a un nuevo nivel de mercado
Conseguir una mayor cantidad de clientes y posicionarse competitivamente por sobre sus rivales.
POLÍTICAS
Posee grandes pero pocos clientes
Gran poder adquisitivo
Satisface ampliamente las necesidades de sus clientes, brindándoles confianza
Conseguir una mejor posición respecto a sus competidores.
ESTRATEGIAS
Expandir el ámbito geográfico, creando varias sucursales en puntos estratégicos del país.
DATOS DEL ENTORNO ESPECÍFICO
Los clientes son bastantes variados y cubren un amplio margen
Sus proveedores, posee algunos rubros
Diversas opciones de las cuales puede elegir y comparar,
Cuenta con pocas alternativas.
Rivales a nivel de mayoreo, varios competidores
PASO 4) INTEGRACIÓN DE DATOS
Una vez construido el Modelo Lógico
Proceder a poblarlo con datos
Utilizando
Técnicas de limpieza
Calidad de datos
Procesos ETL
4.1) Carga Inicial
Debemos en este paso realizar la Carga Inicial del DW
Llevar adelante una serie de tareas básicas
Carga de Dimensión dimClientes
Carga de Dimensión dimProductos
Carga de Dimensión dimFechas
Carga de Tabla de Hechos factVentas
CASO PRÁCTICO
4.2) Actualización
Establecer las políticas y estrategias de actualización periódica.
Siguientes acciones
Determinar el proceso de limpieza de datos
Detalladar las acciones que deberá realizar cada Software
CASO PRÁCTICO
• La información se refrescará: todos los días a las 00:00hs.
• Los datos de las tablas de Dimensiones dimProductos y dimClientes serán cargados siempre en su totalidad.
• Los datos de la tabla de Dimensión dimFechas se cargarán de forma incremental teniendo en cuenta la fecha de la última actualización
• Los datos de la tabla de Hechos factVentas que corresponden al último mes (30 días) a partir de la fecha actual, serán reemplazados cada vez.
• Durante un período de prueba, para analizar cuál es la manera más eficiente de generar las actualizaciones, basadas en el estudio de los cambios que se producen en los Data Sources y que afectan al contenido del DW.
SOLUCION
Inicio
Establecer variables Fecha_Desde y Fecha_Hasta
Carga de Dimensión dimClientes
Carga de Dimensión dimProductos
Carga de Dimensión dimFechas
Carga de Tabla de Hechos factVentas
Obtener datos de Datasource