Olap para una pequeña empresa. Olap en el sentido estricto de la palabra se interpreta como: cubos de olap


OLAP (Procesamiento analítico en línea) es un método de procesamiento electrónico de datos analíticos que representa la organización de datos en categorías jerárquicas utilizando totales precalculados. Los datos OLAP están organizados jerárquicamente y se almacenan en cubos en lugar de tablas. Los cubos OLAP son un conjunto de datos multidimensional con ejes que contienen parámetros y celdas que contienen datos agregados dependientes de parámetros. Los cubos están diseñados para análisis multidimensionales complejos de grandes volúmenes de datos porque solo proporcionan resultados resumidos para la generación de informes, en lugar de una gran cantidad de registros individuales.

El concepto de OLAP fue descrito en 1993 por el famoso investigador de bases de datos y autor del modelo de datos relacionales E. F. Codd. Actualmente, el soporte OLAP está implementado en muchos DBMS y otras herramientas.

Un cubo OLAP contiene dos tipos de datos:

· valores totales, valores para los cuales desea resumir, que representan campos de datos calculados;

· información descriptiva que representa mediciones o dimensiones. La información descriptiva normalmente se organiza en niveles de detalle. Por ejemplo: “Año”, “Trimestre”, “Mes” y “Día” en la dimensión “Tiempo”. La organización de los campos en niveles de detalle permite a los usuarios de informes elegir el nivel de detalle que desean ver, comenzando con datos resumidos de alto nivel y luego profundizando hasta una vista más detallada, y viceversa.

Las herramientas de Microsoft Query también permiten crear cubos OLAP a partir de una consulta que carga datos de una base de datos relacional como Microsoft Access, transformando una tabla lineal en una jerarquía estructurada (cubo).

El Asistente para crear cubos OLAP es una herramienta integrada de Microsoft Query. Para crear un cubo OLAP basado en una base de datos relacional, debe completar los siguientes pasos antes de ejecutar el asistente.

1. Determine la fuente de datos (ver Figura 6.1).

2. Usando Microsoft Query, cree una consulta, incluyendo solo aquellos campos que serán campos de datos o campos de dimensión de un cubo OLAP. Si un campo en un cubo se usa más de una vez, entonces se debe incluir en la consulta la cantidad requerida; numero de veces.

3. En el último paso del asistente de creación de consultas, configure el interruptor en el elemento Crear un cubo OLAP a partir de una consulta determinada(ver Fig. 6.2) o después de crear la solicitud usando el menú Consulta directamente Archivo seleccione un equipo Crear cubo OLAP, después de lo cual se iniciará el Asistente para crear cubos OLAP.

El asistente para crear cubos OLAP consta de tres pasos.

En el primer paso del asistente (ver Fig. 6.6) el Campos de información– campos calculados para los cuales se deben determinar los valores totales.



Arroz. 6.6. Definición de campos de datos

El asistente coloca los campos calculados esperados (generalmente campos numéricos) en la parte superior de la lista, los verifica y determina la función resultante de estos campos, generalmente: Suma. Al seleccionar campos de datos, se debe seleccionar al menos un campo como campo calculado y al menos un campo debe dejarse sin marcar para determinar la dimensión.

Al crear un cubo OLAP, puede utilizar cuatro funciones de resumen: Suma, Número(número de valores), Mínimo, Máximo para campos numéricos y una función Número para todos los demás campos. Si desea utilizar varias funciones de resumen diferentes del mismo campo, ese campo debe incluirse en la consulta la cantidad de veces requerida.

El nombre de un campo calculado se puede cambiar en una columna. Nombre del campo de datos.

En el segundo paso del asistente, se determinan los datos descriptivos y sus dimensiones (ver Fig. 6.7). Para seleccionar un campo de medición, debe de la lista Campos de origen arrastre el campo de dimensión de nivel superior deseado a la lista Mediciones al área marcada como Arrastra los campos aquí para crear dimensiones.. Para crear un cubo OLAP, debe definir al menos una dimensión. En el mismo paso del asistente, puede utilizar el menú contextual para cambiar el nombre del campo de dimensión o nivel.

Arroz. 6.7. Definición de campos de dimensión

Los campos que contienen datos aislados o discretos y no pertenecen a una jerarquía se pueden definir como dimensiones de un solo nivel. Sin embargo, el cubo será más eficiente si algunos de los campos se organizan en niveles. Para crear un nivel como parte de una dimensión, arrastre un campo de la lista Campos de origen en un campo que es una dimensión o nivel. Los campos que contienen información más detallada deben colocarse en niveles inferiores. Por ejemplo, en la Figura 6.7 el campo Título profesional es el nivel del campo Nombre de Departamento.

Para mover un campo a un nivel inferior o superior, debe arrastrarlo a un campo inferior o superior dentro de la dimensión. Para mostrar u ocultar niveles, utilice los botones o respectivamente.

Si utiliza campos de fecha u hora como dimensión de nivel superior, el Asistente para cubos OLAP crea automáticamente niveles para esas dimensiones. Luego, el usuario puede seleccionar qué niveles deben aparecer en los informes. Por ejemplo, puede seleccionar semanas, trimestres y años, o meses (consulte la Figura 6.7).

Recuerde que el asistente crea automáticamente niveles para los campos de fecha y hora sólo cuando crea una dimensión de nivel superior; Al agregar estos campos como subniveles de una dimensión, no se crean niveles automáticos.

En el tercer paso del asistente, se determina el tipo de cubo creado por el asistente, con tres opciones posibles (ver Fig. 6.8).

Arroz. 6.8. Seleccionar el tipo de cubo que se creará en el tercer paso del asistente

· Las dos primeras opciones implican crear un cubo cada vez que abres un informe (si el cubo se ve desde Excel, entonces estamos hablando de una tabla dinámica). En este caso, el expediente de solicitud y el expediente definiciones de cubo *.oqy, que contiene instrucciones para crear un cubo. El archivo *.oqy se puede abrir en Excel para crear informes basados ​​en el cubo y, si necesita realizar cambios en el cubo, puede abrirlo con Consulta para ejecutar nuevamente el Asistente para crear cubos.

De forma predeterminada, los archivos de definición de cubo, como los archivos de consulta, se almacenan en la carpeta de perfil de usuario en Datos de aplicación\Microsoft\Que-ries. Al guardar un archivo *.oqy en la carpeta estándar, el nombre del archivo de definición del cubo se muestra en la pestaña cubos OLAP al abrir una nueva consulta en Microsoft Query o al seleccionar un comando Crear una solicitud(menú Datos, submenú Importar datos externos) en Microsoft Excel.

· En caso de elegir la tercera opción de tipo cubo Guardar un archivo de cubo que contiene todos los datos del cubo, se recuperan todos los datos del cubo y se crea un archivo de cubo con la extensión * en una ubicación especificada por el usuario .cachorro, en el que se almacenan estos datos. Este archivo no se crea inmediatamente cuando se hace clic en el botón Listo; el archivo se crea cuando guarda la definición del cubo en un archivo o cuando crea un informe basado en el cubo.

La elección del tipo de cubo está determinada por varios factores: la cantidad de datos que contiene el cubo; el tipo y complejidad de los informes que se crearán en función del cubo; recursos del sistema (memoria y espacio en disco), etc.

Se debe crear un archivo de cubo *.cub independiente en los siguientes casos:

1) para informes interactivos que se cambian con frecuencia si hay suficiente espacio en disco;

2) cuando necesite guardar el cubo en un servidor de red para proporcionar acceso a él a otros usuarios al crear informes. Un archivo de cubo puede proporcionar datos específicos de la base de datos de origen y al mismo tiempo omitir datos confidenciales o confidenciales a los que desea impedir que otros usuarios accedan.

Las flechas azules indican las vías por las que la información ingresa al sistema; las flechas verdes indican cómo se utiliza posteriormente la información.

  1. La información sobre los pedidos se ingresa en el sistema 1C - versión dbf.
  2. Cargando datos de "intercambio automático". En realidad, este es un paso adicional. Los datos se pueden obtener directamente de la base de datos dbf. Pero los programadores de 1c decidieron que el mecanismo de carga de datos estándar (para 1c) causaría menos daño.
  3. Una vez al día, los cambios del día anterior se cargan en una base de datos MsSql especialmente preparada: almacenamiento. No se descarga toda la información, sino sólo la necesaria para los cubos.

    En principio, no es necesario construir una “instalación de almacenamiento”. Los datos para el cubo se pueden obtener directamente de la base de datos 1C (MsSQL o dbf). Pero en mi caso, desde 1C, los datos de períodos anteriores se eliminan periódicamente y se borran los directorios. Además, antes de cargarlos en el almacenamiento, los datos se “limpian” un poco.

  4. El cubo se vuelve a calcular: los datos van al cubo.
La información del almacenamiento es utilizada no solo por los cubos, sino también por aplicaciones externas; por ejemplo, estos datos son necesarios para el cálculo de la nómina, la contabilidad de pagos y entregas y la planificación del trabajo de un gerente. Al mismo tiempo, los datos de estos programas externos también ingresan a los cubos.

Los empleados de la oficina trabajan con cubos: gestión, gerentes, marketing, contabilidad. También se envía información a proveedores y representantes comerciales en diferentes ciudades de la región.

Cualquier usuario puede obtener información de diferentes formas:

  1. Cree un informe usted mismo en una página web o en Excel

    Al principio sólo se utilizaba Excel, pero surgieron muchos problemas porque los archivos de Excel estaban “dispersos” y era necesario conseguir un “punto de entrada” para seleccionar la información;
    Por lo tanto, se creó un sitio local en el que se publicaron páginas de tabla dinámica. Un empleado que quiere obtener un par de números "aquí y ahora" va a este sitio y elabora un informe en la forma que necesita. Si una persona necesita utilizar este informe en el futuro, puede escribir una solicitud para publicar su informe en SSRS o guardarlo él mismo en Excel.

  2. Ver un informe estándar publicado en SQL Server Reporting Services (SSRS)
  3. Obtenga un cubo local y "rote" datos fuera de la oficina usando Excel
  4. Suscríbase al boletín y reciba informes estándar de SSRS por correo electrónico
  5. El departamento de marketing también utiliza el programa CubeSlice. En él puedes crear cubos locales tú mismo y es mucho más conveniente que en Excel.

Cubos locales

A veces, un usuario necesita recibir periódicamente informes que contienen grandes cantidades de datos. Por ejemplo, el departamento de marketing enviaba informes a los proveedores en forma de archivos Excel de varias decenas de páginas.
Olap no está diseñado para recibir dicha información: los informes tardaron mucho en generarse.

Como regla general, al proveedor también le resulta inconveniente trabajar con informes grandes. Por lo tanto, la mayoría de ellos, después de intentar trabajar con cubos locales, aceptaron recibir informes en este formulario. Se ha reducido significativamente la lista de informes generados por el departamento de marketing. Los informes pesados ​​restantes se implementaron en SSRS, se crearon suscripciones (los informes se generan automáticamente y se envían a los proveedores según un cronograma)

Parámetros básicos del sistema

Configuración del servidor:

Procesador: 2xAMD Opteron 280
memoria: 4Gb
matrices de discos:
sistema operativo: RAID 1 (espejo) 2xSCSI 15k
datos: RAID 0+1 4xSCSI 10k

De acuerdo, es difícil llamar a una máquina así un servidor "potente"

Volumen de datos:

Almacenamiento de 10 GB, datos desde 2002.
agregación 30%
Tamaño de base de datos multidimensional 350M
número de miembros de “grandes dimensiones”: bienes 25 mil, direcciones – 20 mil.
número de documentos por día - 400. número promedio de líneas en un documento - 30

Lo que finalmente recibió la empresa:

pros

  • Para la gestión de la empresa.
    Le permite observar la situación "desde arriba" e identificar patrones generales de desarrollo empresarial.
    Ayuda a rastrear la dinámica de los cambios en los principales indicadores de desempeño de la organización en su conjunto y evaluar rápidamente los indicadores de desempeño de los subordinados.
  • para el gerente
    La capacidad de obtener de forma independiente y rápida la información necesaria para tomar una decisión.
    Facilidad de operación. Todas las acciones son intuitivas.
  • Para proveedores
    Posibilidad de trabajo interactivo con información.
  • Desde el punto de vista de un especialista en TI
    Reducir el trabajo rutinario. El usuario recibe la mayoría de los informes de forma independiente.

Desventajas:

  • Costo de implementación. Se requiere hardware y software adicional.
  • Falta de especialistas capacitados. Costos de capacitación de los empleados del departamento de TI.

En una tabla dinámica estándar, los datos de origen se almacenan en su disco duro local. De esta manera, siempre podrás gestionarlos y reorganizarlos, incluso sin acceso a la red. Pero esto no se aplica de ninguna manera a las tablas dinámicas OLAP. En las tablas dinámicas OLAP, el caché nunca se almacena en el disco duro local. Por lo tanto, inmediatamente después de desconectarse de la red local, su tabla dinámica ya no funcionará. No podrás mover ni un solo campo en él.

Si aún necesita analizar datos OLAP después de desconectarse, cree un cubo de datos sin conexión. Un cubo de datos sin conexión es un archivo independiente que es una caché de tabla dinámica y almacena datos OLAP que se ven después de desconectarse de la red local. Los datos OLAP copiados en una tabla dinámica se pueden imprimir; esto se describe en detalle en el sitio web http://everest.ua.

Para crear un cubo de datos independiente, primero cree una tabla dinámica OLAP. Coloque el cursor dentro de la tabla dinámica y haga clic en el botón Herramientas OLAP en la pestaña contextual Herramientas, que forma parte del grupo de pestañas contextuales Herramientas de tabla dinámica. Seleccione el comando OLAP sin conexión (Fig. 9.8).

Aparece en la pantalla el cuadro de diálogo Configuración del cubo de datos OLAP sin conexión. Haga clic en el botón Crear archivo de datos sin conexión. Ha iniciado el asistente de creación de archivos de Data Cube. Haga clic en el botón Siguiente para continuar con el procedimiento.

Primero debe especificar las dimensiones y niveles que se incluirán en el cubo de datos. En el cuadro de diálogo, debe seleccionar los datos que se importarán desde la base de datos OLAP. La idea es especificar solo aquellas dimensiones que serán necesarias después de desconectar la computadora de la red local. Cuantas más dimensiones especifiques, más grande será el cubo de datos autónomo.

Haga clic en el botón Siguiente para pasar al siguiente cuadro de diálogo del asistente. Le brinda la posibilidad de especificar miembros o elementos de datos que no se incluirán en el cubo. En particular, no necesitará la medida Ventas por Internet-Importe extendido, por lo que su casilla de verificación estará desactivada en la lista. Una casilla de verificación desactivada indica que el elemento especificado no se importará y ocupará espacio innecesario en su disco duro local.

En el último paso, especifique la ubicación y el nombre del cubo de datos. En nuestro caso, el archivo del cubo se llamará MyOfflineCube.cub y estará ubicado en la carpeta Trabajo.

Los archivos de cubo de datos tienen la extensión .cachorro

Después de un tiempo, Excel guardará el cubo de datos sin conexión en la carpeta especificada. Para probarlo, haga doble clic en el archivo, lo que generará automáticamente un libro de Excel que contiene una tabla dinámica asociada con el cubo de datos seleccionado. Una vez creado, puede distribuir el cubo de datos sin conexión a todos los usuarios interesados ​​que estén trabajando en modo LAN sin conexión.

Una vez conectado a su red local, puede abrir el archivo del cubo de datos sin conexión y actualizarlo junto con la tabla de datos correspondiente. El principio fundamental establece que el cubo de datos fuera de línea se usa solo para funcionar cuando la red local está desconectada, pero es necesario actualizarlo después de restablecer la conexión. Intentar actualizar un cubo de datos sin conexión después de un error de conexión provocará un error.

Un archivo de cubo independiente (.cub) almacena datos en un formulario en un cubo de procesamiento analítico en línea (OLAP). Estos datos pueden representar parte de una base de datos OLAP de un servidor OLAP, o pueden haber sido creados independientemente de cualquier base de datos OLAP. Para continuar trabajando con informes de tabla dinámica y gráfico dinámico cuando el servidor no está disponible o sin conexión, utilice un archivo de cubo sin conexión.

Más información sobre los cubos sin conexión

Cuando trabaja con un informe de tabla dinámica o gráfico dinámico basado en un origen de datos de un servidor OLAP, utilice el Asistente para cubos sin conexión para copiar los datos de origen en un archivo de cubo sin conexión independiente en su computadora. Para crear estos archivos sin conexión, debe tener instalado en su computadora un proveedor de datos OLAP que admita estas capacidades, como MSOLAP de Microsoft SQL Server Analysis Services.

Nota: La creación y el uso de archivos de cubo independientes desde Microsoft SQL Server Analysis Services está sujeto a los términos de instalación y licencia de Microsoft SQL Server. Revise la información de licencia adecuada para su versión de SQL Server.

Uso del asistente de cubo sin conexión

Para crear un archivo de cubo sin conexión, utilice el Asistente para cubos sin conexión para seleccionar un subconjunto de datos en la base de datos OLAP y luego guarde ese conjunto. El informe no tiene por qué incluir todos los campos incluidos en el archivo, pudiendo elegir entre cualquiera de sus dimensiones y campos de datos disponibles en la base de datos OLAP. Para minimizar el tamaño del archivo, puede incluir solo los datos que desea poder mostrar en el informe. Puede omitir todas las dimensiones y, para la mayoría de los tipos de dimensiones, también omitir los detalles de nivel inferior y las características de nivel superior que no desea mostrar. Para un archivo sin conexión, también se guardan todos los elementos que se pueden incluir en los campos de propiedades que están disponibles en la base de datos para esos elementos.

Quitar datos fuera de línea y luego volver a ponerlos en línea

Para hacer esto, primero debe crear un informe de tabla dinámica o de gráfico dinámico basado en la base de datos del servidor y luego crear un archivo de cubo independiente a partir del informe. Posteriormente, cuando trabaje con un informe, puede cambiar entre la base de datos del servidor y el archivo fuera de línea en cualquier momento (por ejemplo, cuando trabaja en una computadora portátil en casa o mientras viaja y luego vuelve a conectar la computadora a la red).

A continuación se describen los pasos básicos para desconectar los datos y volver a conectarlos.

Nota:

    Haga clic en el informe de tabla dinámica. Si se trata de un informe de gráfico dinámico, seleccione el informe de tabla dinámica asociado.

    En la "pestaña" Análisis" en grupo cálculos clic en el botón servicio OLAP y presione el botón OLAP sin conexión.

    selecciona un artículo OLAP con conectividad y luego haga clic en el botón DE ACUERDO.

    Si se le solicita buscar una fuente de datos, haga clic en encontrar fuente y busque un servidor OLAP en la red.

    Haga clic en el informe de tabla dinámica basado en el archivo del cubo sin conexión.

    En Excel 2016: en la pestaña " datos" en grupo solicitudes y conexiones Actualizar todo y presione el botón Actualizar.

    En Excel 2013: en la pestaña " datos" en grupo conexiones haga clic en la flecha al lado del botón Actualizar todo y presione el botón Actualizar.

    En la "pestaña" Análisis" en grupo cálculos clic en el botón servicio OLAP y presione el botón OLAP sin conexión.

    Clic en el botón Modo OLAP sin conexión, y luego - .

Nota: Detener en el cuadro de diálogo.

Advertencia:

Crear un archivo de cubo sin conexión desde una base de datos del servidor OLAP

Nota: Si la base de datos OLAP es grande y se necesita el archivo del cubo para proporcionar acceso a un gran subconjunto de datos, se necesitará mucho espacio en disco y guardar el archivo puede llevar mucho tiempo. Para mejorar el rendimiento, se recomienda crear archivos de cubo independientes mediante un script MDX.

Problema: Mi computadora no tiene suficiente espacio en disco al guardar un cubo.

Las bases de datos OLAP están diseñadas para administrar grandes cantidades de datos detallados, por lo que una base de datos alojada en un servidor puede ocupar mucho más espacio del que está disponible en su disco duro local. Si selecciona una gran cantidad de datos para un cubo de datos sin conexión, es posible que no tenga suficiente espacio libre en el disco. El siguiente enfoque ayudará a reducir el tamaño del archivo del cubo sin conexión.

Libere espacio en disco o seleccione un disco diferente Antes de guardar el archivo del cubo, elimine los archivos innecesarios del disco o guarde el archivo en una unidad de red.

Incluir menos datos en un archivo de cubo sin conexión Considere cómo puede minimizar la cantidad de datos incluidos en el archivo para que el archivo contenga todos los datos necesarios para un informe de tabla dinámica o un gráfico dinámico. Pruebe los pasos a continuación.

Conexión de un archivo de cubo sin conexión a una base de datos del servidor OLAP

Actualización y recreación de un archivo de cubo sin conexión

La actualización de un archivo de cubo sin conexión creado a partir de los datos más recientes obtenidos de un cubo de servidor o de un nuevo archivo de cubo sin conexión puede llevar una cantidad significativa de tiempo y requerir una gran cantidad de espacio temporal en el disco. Ejecute este proceso cuando no necesite acceso inmediato a otros archivos, después de asegurarse de tener suficiente espacio en su disco duro.

Problema: Los datos nuevos no aparecen en el informe cuando se actualiza.

Comprobar la disponibilidad de la base de datos de origen Es posible que el archivo del cubo sin conexión no pueda conectarse a la base de datos del servidor de origen para obtener nuevos datos. Asegúrese de que la base de datos original en el servidor que es el origen de datos del cubo no haya cambiado de nombre ni se haya movido a otra ubicación. Asegúrese de que el servidor sea accesible y pueda conectarse.

Comprobando nuevos datos Consulte con el administrador de su base de datos para ver si se han actualizado los datos que deben incluirse en el informe.

Comprobación de la inmutabilidad de la organización de la base de datos. Si el cubo del servidor OLAP se ha modificado, es posible que necesite reorganizar el informe, crear un archivo de cubo sin conexión o ejecutar el Asistente para crear cubos OLAP para acceder a los datos modificados. Para obtener información sobre los cambios en la base de datos, comuníquese con el administrador de su base de datos.

Incluir otros datos en el archivo del cubo sin conexión

Guardar un archivo de cubo sin conexión modificado puede llevar mucho tiempo y no es posible trabajar en Microsoft Excel mientras se guarda el archivo. Ejecute este proceso cuando no necesite acceso inmediato a otros archivos, después de asegurarse de tener suficiente espacio en su disco duro.

    Verifique que haya una conexión de red y que se pueda acceder a la base de datos del servidor OLAP de origen desde la cual el archivo del cubo sin conexión obtuvo los datos.

    Haga clic en un informe de tabla dinámica creado a partir de un archivo de cubo independiente o en un informe de tabla dinámica asociado para obtener un informe de gráfico dinámico.

    en la pestaña Opciones en grupo Servicio clic en el botón servicio OLAP y presione el botón Modo OLAP sin conexión.

    Clic en el botón Modo OLAP sin conexión, y luego - Editar archivo de datos sin conexión.

    Siga el Asistente para cubos sin conexión para seleccionar otros datos para incluir en este archivo. En el último paso, especifique el nombre y la ruta del archivo a cambiar.

Nota: Para cancelar el guardado del archivo, haga clic en el botón Detener en el cuadro de diálogo Creando un archivo de cubo - progreso.

Eliminar un archivo de cubo sin conexión

Advertencia: Si elimina un archivo de cubo sin conexión para un informe, ya no podrá utilizar ese informe sin conexión y ya no podrá crear un archivo de cubo sin conexión para ese informe.

    Cierre todos los libros que contengan informes que utilicen el archivo de cubo sin conexión o asegúrese de que se eliminen todos esos informes.

    En Microsoft Windows, busque y elimine el archivo del cubo sin conexión (archivo CUB).

información adicional

Siempre puede hacer una pregunta en la comunidad tecnológica de Excel, pedir ayuda en la comunidad de Respuestas o sugerir una nueva característica o mejora del sitio web.

En el artículo anterior de esta serie (ver No. 2’2005), hablamos sobre las principales innovaciones de los servicios analíticos en SQL Server 2005. Hoy veremos más de cerca las herramientas para crear soluciones OLAP incluidas en este producto.

Brevemente sobre los conceptos básicos de OLAP.

Antes de empezar a hablar de herramientas para crear soluciones OLAP, recordemos que OLAP (procesamiento analítico en línea) es una tecnología para el análisis de datos multidimensionales complejos, cuyo concepto fue descrito en 1993 por E.F. Codd, el famoso autor del libro relacional. modelo de datos. Actualmente, el soporte OLAP está implementado en muchos DBMS y otras herramientas.

cubos OLAP

¿Qué son los datos OLAP? Para responder a esta pregunta, consideremos un ejemplo sencillo. Supongamos que en la base de datos corporativa de una determinada empresa hay un conjunto de tablas que contienen información sobre ventas de bienes o servicios, y en base a ellas se ha creado una vista de Facturas con los campos País (país), Ciudad (ciudad), Nombre del Cliente (nombre de la empresa cliente), Salesperson (gerente de ventas), OrderDate (fecha de realización del pedido), CategoryName (categoría de producto), ProductName (nombre del producto), ShipperName (empresa de transporte), ExtendedPrice (pago de mercancías), mientras que el El último de estos campos es, de hecho, objeto de análisis.

La selección de datos de dicha vista se puede realizar mediante la siguiente consulta:

SELECCIONE País, Ciudad, Nombre del Cliente, Vendedor,

Fecha del pedido, Nombre de la categoría, Nombre del producto, Nombre del remitente, Precio extendido

DE Facturas

Supongamos que estamos interesados ​​en el valor total de los pedidos realizados por clientes de diferentes países. Para obtener una respuesta a esta pregunta es necesario realizar la siguiente solicitud:

SELECCIONAR País, SUMA (Precio Extendido) DE Facturas

GRUPO POR PAÍS

El resultado de esta consulta será un conjunto unidimensional de datos agregados (en este caso, sumas):

País SUMA (Precio extendido)
Argentina 7327.3
Austria 110788.4
Bélgica 28491.65
Brasil 97407.74
Canadá 46190.1
Dinamarca 28392.32
Finlandia 15296.35
Francia 69185.48
209373.6
...

Si queremos saber el coste total de los pedidos realizados por clientes de diferentes países y entregados por diferentes servicios de entrega, debemos ejecutar una consulta que contenga dos parámetros en la cláusula GROUP BY:

SELECCIONE País, Nombre del remitente, SUMA (Precio extendido) DE Facturas

GRUPO POR PAÍS, Nombre del remitente

Según los resultados de esta consulta, puede crear una tabla similar a esta:

Este conjunto de datos se llama tabla dinámica.

SELECCIONE País, Nombre del remitente, SUMA del vendedor (Precio extendido) DE Facturas

GRUPO POR PAÍS, Nombre del remitente, Año

Con base en los resultados de esta consulta, se puede construir un cubo tridimensional (Fig. 1).

Al agregar parámetros adicionales para el análisis, puede crear un cubo con teóricamente cualquier número de dimensiones y, junto con las sumas, las celdas del cubo OLAP pueden contener los resultados del cálculo de otras funciones agregadas (por ejemplo, valores promedio, máximo, mínimo). , el número de registros de la vista original correspondientes a un conjunto de parámetros determinado). Los campos a partir de los cuales se calculan los resultados se denominan medidas cúbicas.

Jerarquías en dimensiones

Supongamos que estamos interesados ​​no solo en el valor total de los pedidos realizados por clientes en diferentes países, sino también en el valor total de los pedidos realizados por clientes en diferentes ciudades del mismo país. En este caso, puede aprovechar el hecho de que los valores trazados en los ejes tienen diferentes niveles de detalle; esto se describe dentro del concepto de jerarquía de cambios. Digamos que los países están ubicados en el primer nivel de la jerarquía y las ciudades en el segundo. Tenga en cuenta que a partir de SQL Server 2000, los servicios de análisis admiten las llamadas jerarquías desequilibradas, que contienen, por ejemplo, miembros cuyos "hijos" no están contenidos en niveles adyacentes de la jerarquía o faltan para algunos miembros del cambio. Un ejemplo típico de tal jerarquía es tener en cuenta el hecho de que en diferentes países puede haber o no unidades administrativo-territoriales, como un estado o región, ubicadas en la jerarquía geográfica entre países y ciudades (Fig. 2).

Tenga en cuenta que recientemente se ha vuelto común distinguir jerarquías típicas, por ejemplo aquellas que contienen datos geográficos o de tiempo, y también admitir la existencia de varias jerarquías en una dimensión (en particular, para el calendario y el año fiscal).

Creando cubos OLAP en SQL Server 2005

Los cubos de SQL Server 2005 se crean utilizando SQL Server Business Intelligence Development Studio. Esta herramienta es una versión especial de Visual Studio 2005 diseñada para resolver esta clase de problemas (y si ya tiene un entorno de desarrollo instalado, la lista de plantillas de proyectos se complementa con proyectos diseñados para crear soluciones basadas en SQL Sever y sus servicios analíticos) . En particular, la plantilla Proyecto de servicios de análisis está diseñada para crear soluciones basadas en servicios analíticos (Fig. 3).

Para crear un cubo OLAP, primero debe decidir qué datos formarlo. La mayoría de las veces, los cubos OLAP se construyen sobre la base de almacenes de datos relacionales con esquemas de estrella o copo de nieve (hablamos de ellos en la parte anterior del artículo). El paquete SQL incluye un ejemplo de dicho almacenamiento: la base de datos AdventureWorksDW, para usarla como fuente debe buscar la carpeta Fuentes de datos en el Explorador de soluciones, seleccionar el elemento del menú contextual Nueva fuente de datos y responder secuencialmente las preguntas del asistente correspondiente ( Figura 4).

Luego se recomienda crear una vista de origen de datos en la que se creará el cubo. Para hacer esto, debe seleccionar el elemento del menú contextual apropiado en la carpeta Vistas de origen de datos y responder consistentemente a las preguntas del asistente. El resultado de estas acciones será un esquema de datos, con la ayuda del cual se construirá una representación de las fuentes de datos, y en el esquema resultante, en lugar de los originales, se podrán especificar nombres de tablas "descriptivos" (Fig. 5). .

El cubo descrito de esta manera se puede transferir al servidor de servicios analíticos seleccionando la opción Implementar en el menú contextual del proyecto y viendo sus datos (Fig. 7).

La creación de cubos ahora aprovecha muchas de las características de la nueva versión de SQL Server, como la vista de origen de datos. La descripción de los datos de origen para construir un cubo, así como la descripción de la estructura del cubo, ahora se realiza utilizando la herramienta Visual Studio, familiar para muchos desarrolladores, lo cual es una ventaja significativa de la nueva versión de este producto: la En este caso se minimiza el estudio de nuevas herramientas por parte de los desarrolladores de soluciones analíticas.

Tenga en cuenta que en el cubo creado puede cambiar la composición de las medidas, eliminar y agregar atributos de dimensión y agregar atributos calculados de miembros de dimensión en función de los atributos existentes (Fig. 8).

Arroz. 8. Agregue un atributo calculado

Además, los cubos de SQL Server 2005 pueden agrupar u ordenar automáticamente miembros de dimensión por valor de atributo, definir relaciones entre atributos, implementar relaciones de muchos a muchos, determinar métricas comerciales clave y mucho más (aprenda cómo. Todos estos pasos se pueden encontrar en el Tutorial de SQL Server Analysis Services en la Ayuda de ese producto).

En partes posteriores de esta publicación, continuaremos explorando los servicios analíticos de SQL Server 2005 y descubriremos las novedades en el área de soporte de minería de datos.

Selección del editor
Sugiero preparar una deliciosa basturma armenia. Este es un excelente aperitivo de carne para cualquier festín festivo y más. Después de volver a leer...

Un entorno bien pensado afecta la productividad de los empleados y el microclima interno del equipo. Además...

Nuevo artículo: oración para que una rival deje a su marido en el sitio web - con todos los detalles y detalles de muchas fuentes, lo que fue posible...

Kondratova Zulfiya Zinatullovna Institución educativa: República de Kazajstán. ciudad de Petropavlovsk. Minicentro preescolar en KSU con secundaria...
Graduado de la Escuela Superior de Defensa Aérea Político-Militar de Leningrado que lleva su nombre. yu.v. El senador de Andropov Sergei Rybakov es hoy considerado un experto...
Diagnóstico y evaluación del estado de la zona lumbar Dolor en la zona lumbar del lado izquierdo, la zona lumbar del lado izquierdo se produce debido a una irritación...
La pequeña empresa “desaparecida” No hace mucho, el autor de estas líneas tuvo la oportunidad de escuchar esto de boca de una amiga de Diveyevo, Oksana Suchkova...
Ha llegado la temporada de maduración de la calabaza. Anteriormente, todos los años tenía una pregunta, ¿qué es posible? ¿Gachas de arroz con calabaza? ¿Panqueques o pastel?...
Semieje mayor a = 6.378.245 m. Semieje menor b = 6.356.863,019 m El radio de una bola del mismo volumen que el elipsoide de Krasovsky R = 6.371.110...