Seleccione el proceso de negocio para el que se asignará el modelo dimensional. Según la selección, se reúnen los requisitos del proceso de negocio. Un proceso de negocio requiere más de un modelo dimensional.
En el modelado dimensional, la mejor unidad de análisis es el proceso de negocio en el que la organización tiene el mayor interés. Un proceso de negocio es un conjunto de actividades relacionadas. Los procesos de negocio se clasifican según los temas de interés del negocio. Cuando cree una lista de candidatos de procesos de negocio de alto potencial, debe priorizar los requisitos. Algunos ejemplos de procesos de negocio son los clientes, las ganancias, las ventas, las organizaciones y los productos.
Los procesos de negocio no siempre son departamentos de negocio. Por ejemplo, considere un escenario en el que los departamentos de ventas y marketing acceden a los datos de pedido. En este caso, deberá crear un modelo dimensional sencillo para gestionar los datos de pedido en vez de crear modelos dimensionales independientes para los departamentos de ventas y marketing. Si crea modelos dimensionales basados en departamentos, almacenará datos duplicados. La duplicación o redundancia de datos puede ocasionar muchos problemas relacionados con la calidad y coherencia de los datos.
Cuando seleccione un solo proceso de negocio (entre todos los procesos posibles que existen en una empresa), debe priorizar los procesos de negocio según determinados criterios. Los criterios pueden incluir el significado del proceso de negocio, la calidad de los datos en los sistemas de origen y la viabilidad y complejidad de los procesos de negocio.
Cuando identifique los procesos de negocio de un modelo dimensional, reúna los siguientes metadatos:
- Requisitos empresariales del negocio seleccionado para el que diseñará el modelo dimensional
- Procesos de negocio
- Propietarios
- Sistemas de origen que se utilizarán
- Problemas de calidad de los datos
- Términos comunes utilizados en los procesos de negocio
- Otros metadatos relacionados con el negocio
Los modelos dimensionales se utilizan generalmente en dos entornos: el depósito de datos y los sistemas OLTP.
- El depósito de datos y el modelo dimensional
- Cuando particione los datos en un depósito de datos, divida los datos según el tema. Un depósito de datos se basa en un tema.
El depósito de datos contiene temas específicos seleccionados en la organización, como por ejemplo un cliente o un producto. Para una implementación práctica de un depósito de datos, los datos más importantes están contenidos en un proceso de negocio específico. Este requisito es bastante diferente de los requisitos de OLTP.
Las consultas del entorno del depósito de datos son de naturaleza más estratégica y plantean preguntas relacionadas con un ámbito más amplio. Un ejemplo de consulta es "¿Qué productos se venden bien?" o "¿Dónde están mis oficinas de ventas más débiles?". Para responder a esas consultas, el depósito de datos está estructurado y orientado a temas como por ejemplo un producto o una organización.
Estos temas son la unidad más común de particionamiento lógico en el depósito de datos.
- Sistemas OLTP y el modelo dimensional
- En el entorno operativo, los datos se particionan por aplicación o función, ya que el entorno operativo se crea en torno a aplicaciones orientadas a transacciones que realizan un conjunto específico de funciones. El objetivo del entorno operativo es realizar esas funciones lo más rápido posible. Si hay consultas realizadas en el entorno operativo, serán de naturaleza más táctica y deberán responder a las preguntas relacionadas con ese instante en el tiempo. Una consulta de ejemplo puede ser la pregunta "¿Se ha procesado el cheque del Sr. López?"
Cree y estudie la lista de procesos de negocio de empresa
Cree una lista completa de procesos de negocio para toda la empresa. Considere los siguientes factores de asesoramiento al crear la lista:
- Complejidad de los sistemas de origen de cada proceso de negocio
- Disponibilidad de datos de estos sistemas
- Calidad de datos de estos sistemas
- Significado de negocio estratégico de cada proceso de negocio
- Otros factores importantes para los procesos de negocio
Consejo: Puede ser útil asignar valores a cada factor de asesoramiento y proceso de negocio. Cuando asigne valores, puede determinar la prioridad de cada proceso de negocio.
Identifique el proceso de negocio que desea modelar
Priorice los procesos de negocio. Debe identificar el mayor y el menor proceso de viabilidad al crear un modelo dimensional. Este paso resume los factores de asesoramiento que determinado anteriormente. Los procesos más significativos para el negocio deben modelarse primero.
Identifique las entidades y medidas de alto nivel que son comunes en diversos procesos
Determine las entidades empresariales de alto nivel implicadas en cada proceso.
Determine qué entidades son comunes en varios procesos de negocio.
Una vez identificadas las entidades comunes, puede unir los procesos de negocio a través de estas dimensiones comunes (compartidas).
Para crear dimensiones compartidas que se puedan utilizar en toda la empresa, debe asegurarse de que las distintas partes del negocio están de acuerdo con las definiciones de estas entidades comunes. Este proceso puede tardar algún tiempo, ya que las definiciones de las entidades comunes pueden varias entrar las distintas partes del negocio.
Debe definir las entidades comunes inicialmente, ya que si necesita cambiar esta definición en el futuro, las aplicaciones existentes pueden resultar afectadas.
Un depósito de datos debe proporcionar información coherente para las consultas que solicitan información similar. Un método para mantener la coherencia es crear tablas de dimensiones compartidas y utilizadas por todas las aplicaciones y despensas de datos (modelos dimensionales) en el depósito de datos. Los candidatos para las dimensiones compartidas incluyen clientes, tiempo, productos y dimensiones geográficas, como por ejemplo la dimensión de almacenamiento.
El desarrollo de un conjunto de dimensiones compartidas es un reto importante.
Las dimensiones comunes en los procesos de negocio deben representar la información sobre dimensiones de la misma manera. Es decir, se debe compartir la información y los datos subyacentes. Generalmente, cada proceso de negocio tiene su propio esquema que contiene una tabla de hechos, varias tablas de dimensiones compartidas y tablas de dimensiones exclusivas de la función de negocio específica.
Identifique los orígenes de datos
Identifique los orígenes de datos implicados en los procesos de negocio.
Un modelo dimensional se crea a partir de uno de los siguientes orígenes:
- Un depósito de datos para toda la empresa
- Sistemas de origen OLTP (en el caso de las arquitecturas de despensa de datos independientes o dependientes)
- Despensas de datos independientes (en esta situación, quizá le interese consolidar las despensas de datos independientes en otra despensa de datos o depósito de datos)
Seleccione el método de recopilación de requisitos
Los requisitos suelen ser difíciles de definir. Generalmente, sólo después de ver un resultado se puede decidir que el resultado cumple (o no) un requisito. Los requisitos de una organización también cambian a lo largo del tiempo. Lo que es válido un día puede no serlo al día siguiente. A pesar de ello, los requisitos identificados en este punto se utilizan en el ciclo de desarrollo para crear el modelo dimensional.
Las preguntas son:
- ¿Cómo puede crear algo que no se puede definir de forma precisa?
- ¿Cómo sabe cuándo ha identificado correctamente los requisitos?
Aunque no hay ninguna prueba definitiva, generalmente puede empezar el proceso de modelado si sus requisitos incluyen las siguientes preguntas:
Para reunir el conjunto completo de requisitos, debe considerar las siguientes preguntas:
- ¿Quiénes son las personas, los grupos y las organizaciones de interés?
- ¿Qué funciones deben analizarse?
- ¿Por qué son necesarios los datos?
- ¿Cuándo deben registrarse los datos?
- ¿Dónde, a nivel geográfico y organizativo, se producen los procesos relevantes?
- ¿Cómo se mide el rendimiento de las funciones?
- ¿Cómo se mide el rendimiento del proceso de negocio? ¿Qué factores determinan el éxito o el fracaso?
- ¿Cuál es el método de distribución de la información? ¿Es un informe de datos por escrito o por correo electrónico, o se trata de otro método?
- ¿Qué tipos de información faltan para realizar el análisis y la toma de decisiones?
- ¿Qué pasos se han llevado a cabo actualmente para satisfacer la falta de información?
- ¿Qué nivel de detalle habilitaría el análisis de datos?
En general, la mayoría de los métodos para derivar requisitos empresariales cumplen uno de estos dos métodos: controlado por origen y controlado por usuario.
- Controlado por origen
- La recopilación de requisitos controlados por origen se basa en definir los requisitos utilizando los datos de origen en los sistemas operativos de producción. Puede definir los requisitos analizando un modelo de datos de origen si hay un disponible o los diseños de registro físico reales y seleccionando los datos de interés.
La principal ventaja de este método es que le permite saber desde el principio que puede proporcionar todos los datos, dado que ya se limita a lo que hay disponible. Una segunda ventaja es que puede minimizar el tiempo que necesitan los usuarios en las fases iniciales del proyecto. No obstante, nada puede sustituir la importancia y el valor que obtiene cuando implica a los usuarios.
Este método también tiene desventajas:
- Al minimizar la implicación de los usuarios, aumenta el riesgo de producir un conjunto incorrecto de requisitos.
- Según el volumen de los datos de origen de que disponga y de la disponibilidad de los modelos de origen para los datos, este método también puede tardar mucho tiempo.
- Es posible que algunos usuarios necesiten acceder a datos no disponibles actualmente.
Sin la oportunidad de identificar todos los requisitos, no es posible investigar qué es necesario para obtener datos externos. Los
datos externos son datos que existen fuera de la empresa.
Aún así, los datos externos con frecuencia pueden tener un valor significativo para los usuarios de negocio.
El resultado del método controlado por origen es proporcionar lo datos de que dispone, lo que es apropiado en al menos dos casos:
- El método se puede utilizar para desarrollar una lista bastante completa de las dimensiones principales de interés para la empresa. Si tiene previsto crear un depósito de datos para toda la empresa, esto puede minimizar la proliferación de dimensiones duplicadas en las despensas de datos desarrolladas independientemente.
- El análisis de relaciones en los datos de origen puede identificar áreas en las que centrar sus esfuerzos de desarrollo de un depósito de datos.
- Controlado por usuario
- La recopilación de requisitos controlados por usuario es un método basado en definir los requisitos investigando las funciones realizadas por los usuarios. Esto se suele llevar a cabo a través de una serie de reuniones o entrevistas con los usuarios.
La ventaja principal de este método se basa en proporcionar los datos realmente necesarios, no los que están disponibles.
En general, este método tiene un ámbito inferior al método controlado por origen. Por lo tanto, el método controlado por usuario generalmente produce un depósito de datos o una despensa de datos útil en un lapso de tiempo más corto.
Sin embargo, las expectativas se deben gestionar detenidamente. Los usuarios deben comprender claramente que algunos de los datos que necesitan no pueden ponerse a su disposición por diversas razones. No obstante, no debe limitar las preguntas que realicen los usuarios. Cuando defina los requisitos de un depósito de datos, deben fomentarse ideas alternativas. Estos requisitos impiden que elimine requisitos simplemente porque crea que no sean posibles. Si un usuario está demasiado centrado en algo, puede pasar por alto datos útiles que estén disponibles en los sistemas de producción.
La recopilación de requisitos controlados por usuario generalmente es el método elegido, especialmente cuando se desarrollan despensas de datos dependientes o se llenan despensas de datos desde un almacén de empresa de todo el negocio.
Recopilación de los requisitos
Cuando reúna los requisitos, las necesidades de los usuarios de negocio se recopilarán y documentarán. Cuando reúna los requisitos, debe estudiar los procesos de negocio y las actividades del análisis de información con las que se relacionan los usuarios. Generalmente, los usuarios tienen que evaluar o analizar algún aspecto del negocio. Centre sus esfuerzos en recopilar los dos elementos clave de análisis con los que se relacionan los usuarios de negocio diariamente:
- ¿Qué es lo que se analiza?
- ¿Cuáles son los criterios de evaluación?
Cuando reúna los requisitos, debe tratar de comprender el dominio del problema para el que se realiza el modelado. Generalmente, los requisitos en esta fase se documentan informalmente y los esquemas no se detallan en su totalidad. Cuando reúna estos requisitos, identifique las siguientes áreas de interés:
- Identifique las cuestiones más importantes que debe tratar el negocio. Puede asignar valores de importancia a cada cuestión para determinar las cuestiones más importantes que se deben abordar.
- Determine cómo desea el negocio registrar los datos cuando estos cambian.
Por ejemplo, deseará saber cómo gestionar los datos históricos de los productos que ya no están disponibles o de los registros de los empleados.
Análisis de los requisitos
Analice los requisitos empresariales. Determine los requisitos informales y establezca medidas y entidades de alto nivel. Estos objetos pueden convertirse en dimensiones cuando modele los datos. Utilice este borrador como punto de partida para filtrar las entidades y medidas. Puede empezar a trazar la estructura de los requisitos, las dimensiones del trazado, las jerarquías y las medidas de cada parte del modelo de datos.
Resuma el análisis del proceso de negocio
Cree un informe a partir del análisis. El informe debe contener la siguiente información:
- Listado de procesos de negocio
- Priorización de procesos de negocio
- Entidades y medidas de alto nivel, que son comunes entre varios procesos de negocio
- Proceso de negocio identificado para el que se creará el modelo dimensional
- Listado de orígenes de datos
- Recopilación de requisitos que contiene todos los requisitos del proceso de negocio
- Análisis de recopilación de requisitos
- Entidades y medidas de alto nivel identificadas a partir del análisis de requisitos