Durante este paso del ciclo de diseño de modelo dimensional, identificará las medidas y el tipo de medidas incluidas en el modelo dimensional.
Para obtener más información sobre las medidas, consulte Medidas.
Al definir las medidas, se recopilan los siguientes metadatos:
- Nombre de tabla de hechos
- Alias
- Grano
- Definición de negocio
- Frecuencia y estadísticas de carga
- Estadísticas de uso
- Cómo gestionar los datos archivados
- Cómo y cuándo depurar los datos
- Calidad y precisión de los datos
- Grano de dimensiones de fecha y hora
- Claves y cómo se generan las claves
- Información de origen de datos
- Medidas
- Dimensiones
- Información de contacto del propietario de la tabla
Identificación de medidas verdaderas para el grano
Cuando diseñe las medidas de un modelo, identifique las medidas verdaderas para el grano de cada nivel del modelo.
Cuando haya
identificado el grano del modelo dimensional, habrá identificado las medidas preliminares. Puede determinar otras medidas detalladas consultando la definición de grano. Por ejemplo, si tiene medidas detalladas, como el coste por producto individual o el coste del trabajo de fabricación por producto, identifique todas las medidas restantes del modelo.
Identificación de tipos de medidas
Determine
qué tipos de medidas se utilizan en el modelo dimensional. Cada medida de una tabla de hechos debe tener una regla de agregación (o derivación) por omisión.
Determinación de cómo gestionar medidas de año a fecha
Las medidas de año a fecha son valores numéricos que constan de un total agregado desde el inicio del año a la fecha actual. Debe asegurarse de que dichas medidas no se incluyan en una tabla de hechos con los elementos de línea de nivel atómico.
Supongamos que una tabla de hechos almacena datos de ventas para el año 2005. Las ventas de cada mes son aditivas, y añade las ventas para crear totales de año a fecha. Si crea un hecho de año a fecha, como por ejemplo Sales_$$_Year_To_Date, cuando consulte este hecho en agosto de 2005 obtendrá la suma de todas las ventas hasta agosto de 2005.
Los modeladores dimensionales pueden incluir medidas agregadas de año a fecha en la tabla de hechos con el fin de mejorar el rendimiento y también reducir las complejidades cuando se formen consultas de año a fecha. Sin embargo, para evitar confusión, calcule estas medidas en la aplicación del informe.
Gestione las medidas de año a fecha con los métodos siguientes:
- Aplicaciones basadas en OLAP
- Funciones SQL en vistas o procedimientos almacenados
Determinación de cómo gestionar sucesos
Si es una tabla de hechos basada en sucesos, debe determinar cómo gestionar los sucesos.
Las tablas de hechos basadas en sucesos se utilizan para registrar sucesos, como las visitas a páginas web y la asistencia de empleados o alumnos.
Los sucesos no siempre se convierten en medidas. Si gestiona escenarios basados en sucesos en los que no hay medidas, utilice las tablas de hechos basadas en sucesos que constan de seudohechos o de hechos sin hechos.
Tenga en cuenta las siguientes consideraciones asociadas a una tabla de hechos basada en sucesos:
- Las tablas de hechos basadas en sucesos generalmente tienen seudohechos o no tienen ningún hecho.
- Utilice seudohechos para realizar operaciones de recuento.
- Una tabla de sucesos de hechos sin hechos sólo tiene claves foráneas, no hechos.
Utilice las claves foráneas para realizar operaciones de recuento.
Pronóstico del crecimiento de las tablas de hechos
Pronostique el tamaño y el crecimiento de una tabla de hechos para determinar cómo puede ajustar el rendimiento del modelo dimensional.
Puede calcular el tamaño y el crecimiento de la tabla de hechos realizando uno de los pasos siguientes:
- Comprender el negocio
- Por ejemplo, supongamos que el negocio de ventas al por menor genera unos ingresos brutos de 100 millones de dólares americanos. Supongamos también que el precio medio de un elemento de línea es de 2 dólares americanos. Para calcular la cantidad de elementos de línea que necesita, divida los ingresos brutos por el precio medio de un elemento de línea:
100000000 / 2 = 50000000 filas
Por lo tanto, 50 millones de filas se insertan en el esquema de estrella para el proceso de negocio de ventas al por menor de este grano.
- Realice el cálculo desde una perspectiva técnica
- Determine el tamaño de las claves foráneas, dimensiones degeneradas y medidas. Multiplique estas columnas por el número máximo de filas que se puedan insertar, suponiendo que todos los productos se venden en todos los almacenes cada día. Por ejemplo, en el proceso de negocio de ventas al por menor, realice los pasos siguientes:
- Calcule el número de filas que hay en cada una de las dimensiones:
Dimensión de hora: 4 filas
Dimensión de fecha: 365 filas durante 1 año
Dimensión de producto: 100 filas (100 productos)
Dimensiones de almacén: 2 filas (2 almacenes)
Dimensión de cliente: 1000000 clientes
Dimensión de proveedor: 50 proveedores
Dimensión de empleado: 10 empleados
- Calcule el nivel base de los registros de hechos multiplicando el número de filas de cada dimensión. Utilice los números que haya obtenido en el paso anterior:
4 * 365 * 100 * 2 * 1000000 * 50 * 10 = 730000000 filas
Nota: Este número puede ser mayor de lo que espera. El número sólo se aplica si cada empleado de cada almacén vende cada producto a cada cliente.
- Calcule el crecimiento máximo del tamaño de tabla de hechos:
Número de claves foráneas: 8
Número de dimensiones degeneradas: 1
Número de medidas: 8
Supongamos que la tabla de hechos ocupa 4 bytes para una columna ENTEROS, y calcule el tamaño de una sola fila: (8 + 1 + 8) * 4 bytes = 68 bytes
Calcule el crecimiento máximo de los datos para un solo año del modelo dimensional: 730000000 filas * 68 bytes = 45 GB