Olap pro malou společnost. Olap v užším slova smyslu se vykládá jako: olap kostky


OLAP (On-Line Analytical Processing) je metoda elektronického analytického zpracování dat, která představuje uspořádání dat do hierarchických kategorií pomocí předem vypočítaných součtů. Data OLAP jsou organizována hierarchicky a jsou uložena spíše v krychlích než v tabulkách. Krychle OLAP jsou vícerozměrná datová sada s osami obsahujícími parametry a buňkami obsahujícími agregovaná data závislá na parametrech. Kostky jsou navrženy pro komplexní multidimenzionální analýzu velkých objemů dat, protože poskytují pouze souhrnné výsledky pro reportování namísto velkého počtu jednotlivých záznamů.

Koncept OLAP popsal v roce 1993 slavný databázový výzkumník a autor relačního datového modelu E. F. Codd. V současné době je podpora OLAP implementována v mnoha DBMS a dalších nástrojích.

OLAP kostka obsahuje dva typy dat:

· celkové hodnoty, hodnoty, které chcete shrnout, představující vypočítaná datová pole;

· popisné informace představující Měření nebo rozměry. Popisné informace jsou obvykle uspořádány do úrovní podrobností. Například: „Rok“, „Čtvrtletí“, „Měsíc“ a „Den“ v dimenzi „Čas“. Uspořádání polí do úrovní podrobností umožňuje uživatelům sestav vybrat si úroveň podrobností, kterou chtějí zobrazit, počínaje souhrnnými daty na vysoké úrovni a poté přejít k podrobnějšímu zobrazení a naopak.

Nástroje Microsoft Query také umožňují vytvářet krychle OLAP z dotazu, který načítá data z relační databáze, jako je Microsoft Access, a transformuje lineární tabulku do strukturované hierarchie (krychle).

Průvodce vytvořením krychle OLAP je vestavěný nástroj Microsoft Query. Chcete-li vytvořit krychli OLAP založenou na relační databázi, musíte před spuštěním průvodce provést následující kroky.

1. Určete zdroj dat (viz obrázek 6.1).

2. Pomocí Microsoft Query vytvořte dotaz, včetně pouze těch polí, která budou buď datovými poli nebo dimenzemi krychle OLAP; pokud je pole v krychli použito více než jednou, musí být v dotazu zahrnuto požadované kolikrát.

3. V posledním kroku průvodce vytvořením dotazu nastavte přepínač na položce Vytvoření krychle OLAP z daného dotazu(viz obr. 6.2) nebo po vytvoření požadavku přímo pomocí nabídky Dotaz Soubor vybrat tým Vytvořte OLAP kostku, poté se spustí Průvodce vytvořením OLAP kostky.

Průvodce vytvořením krychle OLAP se skládá ze tří kroků.

V prvním kroku průvodce (viz obr. 6.6) se datová pole– vypočítaná pole, pro která je třeba určit celkové hodnoty.



Rýže. 6.6. Definování datových polí

Průvodce umístí očekávaná vypočítaná pole (obvykle číselná pole) na začátek seznamu, zkontroluje je a určí výslednou funkci těchto polí, obvykle - Součet. Při výběru datových polí musí být alespoň jedno pole vybráno jako výpočtové pole a alespoň jedno pole musí zůstat nezaškrtnuté, aby bylo možné určit rozměr.

Při vytváření krychle OLAP můžete použít čtyři souhrnné funkce − Součet, Číslo(počet hodnot), Minimální, Maximum pro číselná pole a jednu funkci Číslo pro všechny ostatní obory. Pokud chcete použít několik různých souhrnných funkcí stejného pole, musí být toto pole zahrnuto v dotazu požadovaný početkrát.

Název počítaného pole lze ve sloupci změnit Název datového pole.

Ve druhém kroku průvodce se určí popisné údaje a jejich rozměry (viz obr. 6.7). Chcete-li vybrat pole měření, musíte ze seznamu Zdrojová pole přetáhněte požadované pole dimenze nejvyšší úrovně do seznamu Měření do oblasti označené jako Přetažením polí sem vytvořte kóty. Chcete-li vytvořit krychli OLAP, musíte definovat alespoň jednu dimenzi. Ve stejném kroku průvodce můžete pomocí místní nabídky změnit název pole dimenze nebo úrovně.

Rýže. 6.7. Definování polí dimenzí

Pole, která obsahují izolovaná nebo diskrétní data a nepatří do hierarchie, lze definovat jako dimenze s jednou úrovní. Kostka však bude efektivnější, pokud budou některá pole uspořádána do úrovní. Chcete-li vytvořit úroveň jako součást kóty, přetáhněte pole ze seznamu Zdrojová pole na poli, které je dimenzí nebo úrovní. Pole obsahující podrobnější informace by měla být umístěna na nižších úrovních. Například na obrázku 6.7 pole Pracovní pozice je úroveň pole Název oddělení.

Chcete-li přesunout pole na nižší nebo vyšší úroveň, musíte je přetáhnout na nižší nebo vyšší pole v rámci dimenze. Chcete-li zobrazit nebo skrýt úrovně, použijte tlačítka nebo .

Pokud jako dimenze nejvyšší úrovně použijete pole data nebo času, Průvodce krychlí OLAP automaticky vytvoří úrovně pro tyto dimenze. Uživatel si pak může vybrat, které úrovně se mají v přehledech objevit. Můžete například vybrat týdny, čtvrtletí a roky nebo měsíce (viz obrázek 6.7).

Pamatujte, že průvodce automaticky vytvoří úrovně pro pole data a času pouze tehdy, když vytvoříte dimenzi nejvyšší úrovně; Při přidávání těchto polí jako podúrovní dimenze se nevytvářejí automatické úrovně.

Ve třetím kroku průvodce se určí typ krychle vytvořené průvodcem, přičemž jsou možné tři možnosti (viz obr. 6.8).

Rýže. 6.8. Výběr typu krychle, která má být vytvořena, ve třetím kroku průvodce

· První dvě možnosti zahrnují vytvoření krychle pokaždé, když otevřete sestavu (pokud je krychle zobrazena z Excelu, pak mluvíme o kontingenční tabulce). V tomto případě soubor žádosti a spis definice krychle *.oqy, který obsahuje návod na vytvoření krychle. Soubor *.oqy lze otevřít v Excelu a vytvářet sestavy založené na krychli, a pokud potřebujete provést změny v krychli, můžete jej otevřít pomocí Query a znovu spustit Průvodce vytvořením krychle.

Ve výchozím nastavení jsou soubory definic krychle, stejně jako soubory dotazů, uloženy ve složce profilu uživatele v Application Data\Microsoft\Que-ries. Při ukládání souboru *.oqy do standardní složky se na kartě zobrazí název definičního souboru krychle OLAP kostky při otevírání nového dotazu v Microsoft Query nebo při výběru příkazu Vytvořte žádost(Jídelní lístek Data, podnabídka Import externích dat) v aplikaci Microsoft Excel.

· V případě výběru třetí možnosti typu kostky Uložení souboru krychle obsahující všechna data pro krychli, načtou se všechna data pro krychli a vytvoří se soubor krychle s příponou * na uživatelem zadaném místě .mládě, ve kterém jsou tato data uložena. Tento soubor se nevytvoří okamžitě po kliknutí na tlačítko Připraveno; soubor se vytvoří buď při uložení definice krychle do souboru, nebo při vytvoření sestavy založené na krychli.

Výběr typu krychle je určen několika faktory: množstvím dat, která krychle obsahuje; typ a složitost sestav, které budou vytvořeny na základě krychle; systémové prostředky (paměť a místo na disku) atd.

Samostatný soubor krychle *.cub by měl být vytvořen v následujících případech:

1) pro často se měnící interaktivní sestavy, pokud je na disku dostatek místa;

2) když potřebujete uložit krychli na síťový server, abyste k ní měli přístup pro ostatní uživatele při vytváření sestav. Soubor krychle může poskytnout konkrétní data ze zdrojové databáze a zároveň vynechat citlivá nebo citlivá data, ke kterým chcete zabránit ostatním uživatelům v přístupu.

Modré šipky označují cesty, kterými informace vstupují do systému, zelené šipky označují, jak jsou informace následně použity.

  1. Informace o objednávkách se zadávají do systému 1c - verze dbf.
  2. Načítání dat „automatické výměny“. Ve skutečnosti je to krok navíc. Data lze získat přímo z databáze dbf. Ale programátoři 1c se rozhodli, že standardní (pro 1c) mechanismus nahrávání dat nadělá méně škody.
  3. Jednou denně se změny za uplynulý den nahrávají do speciálně připravené databáze MsSql – úložiště. Nestahují se všechny informace, ale jen to, co je pro kostky potřeba.

    V zásadě není nutné budovat „skladiště“. Data pro kostku lze získat přímo z databáze 1C (MsSQL nebo dbf). Ale v mém případě z 1C jsou data z předchozích období pravidelně mazána a adresáře jsou vymazány. Kromě toho se před načtením do úložiště data trochu „vyčistí“.

  4. Kostka se přepočítá - data jdou do krychle.
Informace z úložiště využívají nejen kostky, ale i externí aplikace, například tato data jsou potřebná pro výpočet mezd, pro účtování plateb a dodávek, pro plánování práce manažera. Zároveň do kostek vstupují i ​​data z těchto externích programů.

S kostkami pracují zaměstnanci v kanceláři – management, manažeři, marketing, účetnictví. Informace jsou také zasílány dodavatelům a obchodním zástupcům v různých městech regionu.

Každý uživatel může získat informace různými způsoby:

  1. Sestavte si sestavu sami na webové stránce nebo v Excelu

    Zpočátku se používal pouze Excel, ale mnoho problémů nastávalo s „rozsypáním“ excelových souborů, pro výběr informací bylo nutné získat jeden „vstupní bod“.
    Proto byl vytvořen lokální web, na kterém byly publikovány stránky z kontingenční tabulky. Zaměstnanec, který chce získat několik čísel „tady a teď“, jde na tuto stránku a vytvoří zprávu ve formě, kterou potřebuje. Pokud by člověk potřeboval tuto sestavu v budoucnu využít, může napsat žádost o zveřejnění své sestavy v SSRS nebo si ji sám uložit v Excelu.

  2. Zobrazení standardní sestavy publikované službou SQL Server Reporting Services (SSRS)
  3. Získejte místní krychli – a mimo kancelář „otočte“ data pomocí Excelu
  4. Přihlaste se k odběru newsletteru a dostávejte standardní zprávy od SSRS e-mailem
  5. Marketingové oddělení rovněž využívá program CubeSlice. V něm si můžete sami vytvářet lokální kostky a je to mnohem pohodlnější než v Excelu

Místní kostky

Někdy uživatel potřebuje pravidelně dostávat zprávy obsahující velké množství dat. Marketingové oddělení například zasílalo dodavatelům reporty ve formě excelových souborů obsahujících několik desítek stránek.
Olap není určen k přijímání takových informací – generování zpráv trvalo velmi dlouho.

Zpravidla je také pro dodavatele nepohodlné pracovat s velkými reporty. Proto většina z nich, když si vyzkoušela práci s místními kostkami, souhlasila s přijímáním zpráv v této podobě. Seznam reportů generovaných marketingovým oddělením byl výrazně zredukován. Zbývající těžké zprávy byly implementovány v SSRS, byla vytvořena předplatná (zprávy jsou generovány automaticky a odesílány dodavatelům podle plánu)

Základní parametry systému

Konfigurace serveru:

procesor: 2xAMD Opteron 280
paměť: 4Gb
disková pole:
operační systém: RAID 1 (zrcadlový) 2xSCSI 15k
data: RAID 0+1 4xSCSI 10k

Souhlasíte, je obtížné nazvat takový stroj „výkonným“ serverem

Objem dat:

10GB úložiště, data od roku 2002
agregace 30 %
Velikost multidimenzionální databáze 350M
počet členů „velkých dimenzí“: zboží 25 tis., adresy – 20 tis.
počet dokladů za den - 400. průměrný počet řádků v dokladu - 30

S čím společnost skončila:

klady

  • Pro vedení podniku
    Umožňuje podívat se na situaci „shora“ a identifikovat obecné vzorce rozvoje podnikání.
    Pomáhá sledovat dynamiku změn hlavních výkonnostních ukazatelů organizace jako celku a rychle vyhodnocovat výkonnostní ukazatele podřízených.
  • Pro manažera
    Schopnost samostatně a rychle získat informace potřebné k rozhodnutí.
    Snadné ovládání. Všechny akce jsou intuitivní
  • Pro dodavatele
    Možnost interaktivní práce s informacemi
  • Z pohledu IT specialisty
    Snížení rutinní práce. Uživatel přijímá většinu zpráv nezávisle.

mínusy:

  • Náklady na implementaci. Je vyžadován další hardware a software.
  • Nedostatek vyškolených specialistů. Náklady na školení zaměstnanců IT oddělení.

Ve standardní kontingenční tabulce jsou zdrojová data uložena na vašem místním pevném disku. Tímto způsobem je můžete vždy spravovat a reorganizovat, a to i bez přístupu k síti. To ale v žádném případě neplatí pro kontingenční tabulky OLAP. V kontingenčních tabulkách OLAP se mezipaměť nikdy neukládá na místní pevný disk. Ihned po odpojení od lokální sítě tedy vaše kontingenční tabulka přestane fungovat. Nepohnete v něm ani jedním polem.

Pokud i po přechodu do režimu offline stále potřebujete analyzovat data OLAP, vytvořte offline datovou krychli. Offline datová krychle je samostatný soubor, který je mezipamětí kontingenční tabulky a ukládá data OLAP, která jsou zobrazena po odpojení od místní sítě. Data OLAP zkopírovaná do kontingenční tabulky lze vytisknout, což je podrobně popsáno na webu http://everest.ua.

Chcete-li vytvořit samostatnou datovou krychli, nejprve vytvořte kontingenční tabulku OLAP. Umístěte kurzor do kontingenční tabulky a klikněte na tlačítko Nástroje OLAP na kontextové kartě Nástroje, která je součástí skupiny kontextových karet Nástroje kontingenční tabulky. Vyberte příkaz Offline OLAP (obr. 9.8).

Na obrazovce se zobrazí dialogové okno Offline OLAP Data Cube Settings. Klikněte na tlačítko Vytvořit datový soubor offline. Spustili jste Průvodce vytvořením souboru datové krychle. Klepnutím na tlačítko Další pokračujte v postupu.

Nejprve je třeba určit rozměry a úrovně, které budou zahrnuty do datové kostky. V dialogovém okně musíte vybrat data, která budou importována z databáze OLAP. Cílem je zadat pouze ty rozměry, které budou potřeba po odpojení počítače od místní sítě. Čím více dimenzí zadáte, tím větší bude autonomní datová krychle.

Klepnutím na tlačítko Další se přesunete do dalšího dialogového okna průvodce. To vám dává možnost určit členy nebo datové prvky, které nebudou zahrnuty do krychle. Konkrétně nebudete potřebovat míru Internet Sales-Extended Amount, takže její zaškrtávací políčko bude v seznamu zrušeno. Zrušené zaškrtávací políčko znamená, že zadaná položka nebude importována a zabírá zbytečně místo na vašem místním pevném disku.

V posledním kroku zadejte umístění a název datové krychle. V našem případě se soubor krychle bude jmenovat MyOfflineCube.cub a bude se nacházet ve složce Práce.

Soubory datových krychlí mají příponu .mládě

Po nějaké době Excel uloží offline datovou kostku do zadané složky. Chcete-li to otestovat, poklepejte na soubor, čímž se automaticky vygeneruje sešit aplikace Excel, který obsahuje kontingenční tabulku spojenou s vybranou datovou krychlí. Po vytvoření můžete offline datovou kostku distribuovat všem zainteresovaným uživatelům, kteří pracují v offline režimu LAN.

Po připojení k místní síti můžete otevřít soubor offline datové krychle a aktualizovat jej a odpovídající datovou tabulku. Hlavní princip říká, že offline datová kostka slouží pouze k práci při odpojení lokální sítě, ale po obnovení připojení je nutné ji aktualizovat. Pokus o aktualizaci offline datové krychle po selhání připojení bude mít za následek selhání.

Samostatný soubor krychle (.cub) ukládá data ve formě v krychli online analytického zpracování (OLAP). Tato data mohou představovat část databáze OLAP ze serveru OLAP nebo mohou být vytvořena nezávisle na jakékoli databázi OLAP. Chcete-li pokračovat v práci se sestavami kontingenčních tabulek a grafů, když je server nedostupný nebo offline, použijte soubor offline krychle.

Další informace o offline kostkách

Když pracujete se sestavou kontingenční tabulky nebo kontingenčního grafu, která je založena na zdroji dat ze serveru OLAP, zkopírujte zdrojová data do samostatného souboru offline krychle v počítači pomocí Průvodce offline krychlí. Chcete-li vytvořit tyto offline soubory, musíte mít v počítači nainstalovaného poskytovatele dat OLAP, který podporuje tyto funkce, jako je MSOLAP od Microsoft SQL Server Analysis Services.

Poznámka: Vytváření a používání samostatných souborů krychle ze služby Microsoft SQL Server Analysis Services podléhá podmínkám instalace a licencování Microsoft SQL Server. Zkontrolujte příslušné licenční informace pro vaši verzi SQL Server.

Pomocí Průvodce krychle offline

Chcete-li vytvořit soubor offline krychle, vyberte pomocí Průvodce offline krychlí podmnožinu dat v databázi OLAP a pak tuto sadu uložte. Sestava nemusí obsahovat všechna pole obsažená v souboru a můžete vybrat kteroukoli z jejích dimenzí a datových polí dostupných v databázi OLAP. Chcete-li minimalizovat velikost souboru, můžete zahrnout pouze data, která chcete v sestavě zobrazit. Můžete přeskočit všechny dimenze a u většiny typů dimenzí také vynechat detaily nižší úrovně a prvky nejvyšší úrovně, které nechcete zobrazovat. U offline souboru se také uloží všechny prvky, které lze zahrnout do polí vlastností, která jsou pro tyto prvky k dispozici v databázi.

Převedení dat do režimu offline a následné převedení dat zpět do režimu online

Chcete-li to provést, musíte nejprve vytvořit sestavu kontingenční tabulky nebo sestavu kontingenčního grafu, která je založena na databázi serveru, a poté ze sestavy vytvořit samostatný soubor krychle. Následně při práci s reportem můžete kdykoliv přepínat mezi databází serveru a offline souborem (například při práci na notebooku doma nebo na cestách a následném opětovném připojení počítače k ​​síti).

Níže jsou popsány základní kroky pro převedení dat do režimu offline a jejich opětovné uvedení do režimu online.

Poznámka:

    Klepněte na sestavu kontingenční tabulky. Pokud se jedná o sestavu kontingenčního grafu, vyberte přidruženou sestavu kontingenční tabulky.

    Na záložce Analýza" ve skupině výpočty klikněte na tlačítko Služba OLAP a stiskněte tlačítko OLAP offline.

    Vyberte položku OLAP s konektivitou a potom klepněte na tlačítko OK.

    Pokud se zobrazí výzva k vyhledání zdroje dat, klepněte na tlačítko Najít zdroj a najděte v síti server OLAP.

    Klepněte na sestavu kontingenční tabulky, která je založena na souboru offline krychle.

    V Excelu 2016: Na kartě „ data" ve skupině požadavky a spojení Aktualizovat vše a stiskněte tlačítko Aktualizace.

    V Excelu 2013: Na kartě „ data" ve skupině spojení klikněte na šipku vedle tlačítka Aktualizovat vše a stiskněte tlačítko Aktualizace.

    Na záložce Analýza" ve skupině výpočty klikněte na tlačítko Služba OLAP a stiskněte tlačítko OLAP offline.

    Klepněte na tlačítko Offline režim OLAP, a pak - .

Poznámka: Stop v dialogovém okně.

Varování:

Vytvoření souboru offline krychle z databáze serveru OLAP

Poznámka: Pokud je databáze OLAP velká a soubor datové krychle je potřebný k poskytnutí přístupu k velké podmnožině dat, bude zapotřebí hodně místa na disku a uložení souboru může trvat dlouho. Pro zlepšení výkonu se doporučuje vytvářet samostatné soubory krychle pomocí skriptu MDX.

Problém: Můj počítač nemá při ukládání krychle dostatek místa na disku.

Databáze OLAP jsou navrženy pro správu velkého množství podrobných dat, takže databáze hostovaná na serveru může zabírat podstatně více místa, než je k dispozici na vašem místním pevném disku. Pokud vyberete velké množství dat pro offline datovou krychli, možná nebudete mít dostatek volného místa na disku. Následující přístup pomůže snížit velikost souboru offline krychle.

Uvolněte místo na disku nebo vyberte jiný disk Před uložením souboru krychle odstraňte nepotřebné soubory z disku nebo uložte soubor na síťovou jednotku.

Zahrnutí méně dat do offline souboru krychle Zvažte, jak můžete minimalizovat množství dat obsažených v souboru, aby soubor obsahoval všechna data potřebná pro sestavu kontingenční tabulky nebo kontingenčního grafu. Vyzkoušejte níže uvedené kroky.

Připojení souboru offline krychle k databázi serveru OLAP

Aktualizace a opětovné vytvoření souboru offline krychle

Aktualizace souboru offline krychle, který je vytvořen z nejnovějších dat získaných z datové krychle serveru nebo z nového souboru offline krychle, může zabrat značné množství času a vyžadovat velké množství dočasného místa na disku. Tento proces spusťte, když nepotřebujete okamžitý přístup k jiným souborům, poté, co se ujistěte, že máte na pevném disku dostatek místa.

Problém: Nová data se po aktualizaci neobjeví v sestavě.

Kontrola dostupnosti zdrojové databáze Soubor krychle offline nemusí být schopen se připojit k databázi zdrojového serveru a získat nová data. Ujistěte se, že původní databáze na serveru, který je zdrojem dat pro datovou krychli, nebyla přejmenována nebo přesunuta do jiného umístění. Ujistěte se, že je server přístupný a lze se k němu připojit.

Kontrola nových dat Ověřte si u správce databáze, zda byla aktualizována data, která by měla být zahrnuta do sestavy.

Kontrola neměnnosti organizace databáze Pokud byla krychle serveru OLAP změněna, budete možná muset reorganizovat sestavu, vytvořit soubor offline krychle nebo spustit Průvodce vytvořením krychle OLAP, abyste získali přístup ke změněným datům. Chcete-li se dozvědět o změnách databáze, kontaktujte správce databáze.

Včetně dalších dat v souboru offline krychle

Uložení upraveného souboru offline krychle může být časově náročné a během ukládání souboru nemůžete pracovat v aplikaci Microsoft Excel. Tento proces spusťte, když nepotřebujete okamžitý přístup k jiným souborům, poté, co se ujistěte, že máte na pevném disku dostatek místa.

    Ověřte, že existuje síťové připojení a že zdrojová databáze serveru OLAP, ze které soubor offline krychle získal data, je přístupná.

    Klikněte na sestavu kontingenční tabulky vytvořenou ze samostatného souboru krychle nebo na přidruženou sestavu kontingenční tabulky pro sestavu kontingenčního grafu.

    Na kartě Možnosti ve skupině Servis klikněte na tlačítko Služba OLAP a stiskněte tlačítko Offline režim OLAP.

    Klepněte na tlačítko Offline režim OLAP, a pak - Upravit offline datový soubor.

    Postupujte podle průvodce Offline Cube Wizard a vyberte další data, která chcete zahrnout do tohoto souboru. V posledním kroku zadejte název a cestu k souboru, který chcete změnit.

Poznámka: Chcete-li zrušit ukládání souboru, klepněte na tlačítko Stop v dialogovém okně Vytvoření souboru krychle - průběh.

Odstranění souboru offline krychle

Varování: Pokud odstraníte soubor offline krychle pro sestavu, nebudete již moci tuto sestavu používat v režimu offline a nebudete již moci pro tuto sestavu vytvořit soubor offline krychle.

    Zavřete všechny sešity obsahující sestavy, které používají soubor offline krychle, nebo zajistěte, aby byly všechny takové sestavy odstraněny.

    V systému Microsoft Windows vyhledejte a odstraňte soubor offline krychle (soubor CUB).

dodatečné informace

Vždy můžete položit otázku z komunity Excel Tech Community, požádat o pomoc v komunitě odpovědí nebo navrhnout novou funkci nebo vylepšení webu

V předchozím článku této série (viz č. 2’2005) jsme hovořili o hlavních inovacích analytických služeb v SQL Server 2005. Dnes se blíže podíváme na nástroje pro tvorbu OLAP řešení obsažené v tomto produktu.

Stručně o základech OLAP

Než začneme mluvit o nástrojích pro tvorbu OLAP řešení, připomeňme, že OLAP (On-Line Analytical Processing) je technologie pro komplexní multidimenzionální analýzu dat, jejíž koncept popsal v roce 1993 E.F. Codd, slavný autor relačního datový model. V současné době je podpora OLAP implementována v mnoha DBMS a dalších nástrojích.

OLAP kostky

Co jsou data OLAP? Chcete-li odpovědět na tuto otázku, zvažte jednoduchý příklad. Předpokládejme, že v podnikové databázi určitého podniku existuje sada tabulek obsahujících informace o prodeji zboží nebo služeb a na jejich základě byl vytvořen pohled Faktury s poli Země (země), Město (město), Jméno zákazníka (název klientské společnosti), Salesperson (manažerka prodeje), OrderDate (datum zadání objednávky), CategoryName (kategorie produktu), ProductName (název produktu), ShipperName (přepravní společnost), ExtendedPrice (platba za zboží), přičemž poslední z těchto polí je ve skutečnosti předmětem analýzy.

Výběr dat z takového zobrazení lze provést pomocí následujícího dotazu:

VYBERTE zemi, město, jméno zákazníka, prodejce,

Datum objednávky, název kategorie, název produktu, název odesílatele, rozšířená cena

Z faktur

Předpokládejme, že nás zajímá celková hodnota objednávek provedených zákazníky z různých zemí. Chcete-li získat odpověď na tuto otázku, musíte podat následující žádost:

VYBERTE zemi, SOUČET (ExtendedPrice) Z faktur

SKUPINA PODLE zemí

Výsledkem tohoto dotazu bude jednorozměrná sada agregovaných dat (v tomto případě součtů):

Země SUM (rozšířená cena)
Argentina 7327.3
Rakousko 110788.4
Belgie 28491.65
Brazílie 97407.74
Kanada 46190.1
Dánsko 28392.32
Finsko 15296.35
Francie 69185.48
209373.6
...

Pokud chceme znát celkové náklady na objednávky zadané zákazníky z různých zemí a doručené různými doručovacími službami, musíme spustit dotaz obsahující dva parametry v klauzuli GROUP BY:

VYBERTE zemi, jméno odesílatele, SUM (rozšířená cena) z faktur

SKUPINA PODLE ZEMĚ, Jméno odesílatele

Na základě výsledků tohoto dotazu můžete vytvořit tabulku, která vypadá takto:

Tato sada dat se nazývá kontingenční tabulka.

VYBERTE zemi, jméno odesílatele, součet prodejců (rozšířená cena) z faktur

SKUPINA PODLE ZEMĚ, Jméno odesílatele, Rok

Na základě výsledků tohoto dotazu lze sestrojit trojrozměrnou krychli (obr. 1).

Přidáním dalších parametrů pro analýzu můžete vytvořit krychli s teoreticky libovolným počtem dimenzí a spolu se součty mohou buňky OLAP kostky obsahovat výsledky výpočtu dalších agregačních funkcí (například průměrné, maximální, minimální hodnoty , počet záznamů původního pohledu odpovídající daným nastaveným parametrům). Pole, ze kterých se počítají výsledky, se nazývají krychlové míry.

Hierarchie v dimenzích

Předpokládejme, že nás zajímá nejen celková hodnota objednávek provedených zákazníky v různých zemích, ale také celková hodnota objednávek provedených zákazníky v různých městech stejné země. V tomto případě můžete využít toho, že hodnoty vynesené na osách mají různou úroveň detailu – to je popsáno v rámci konceptu hierarchie změn. Řekněme, že země se nacházejí na prvním stupni hierarchie, města na druhém. Všimněte si, že počínaje SQL Serverem 2000 analytické služby podporují tzv. nevyvážené hierarchie, které obsahují například členy, jejichž „děti“ nejsou obsaženy na sousedních úrovních hierarchie nebo u některých členů změny chybí. Typickým příkladem takové hierarchie je zohlednění skutečnosti, že v různých zemích mohou a nemusí existovat administrativně-územní jednotky jako stát nebo region, umístěné v geografické hierarchii mezi zeměmi a městy (obr. 2).

Všimněte si, že v poslední době bylo běžné rozlišovat typické hierarchie, například ty, které obsahují geografická nebo časová data, a také podporovat existenci několika hierarchií v jedné dimenzi (zejména pro kalendářní a fiskální rok).

Vytváření krychlí OLAP v SQL Server 2005

Krychle SQL Server 2005 jsou vytvářeny pomocí SQL Server Business Intelligence Development Studio. Tento nástroj je speciální verzí Visual Studia 2005 navrženou pro řešení této třídy problémů (a pokud máte již nainstalované vývojové prostředí, je seznam šablon projektů doplněn o projekty určené k vytváření řešení na bázi SQL Sever a jeho analytických služeb) . Konkrétně šablona Analysis Services Project je určena pro vytváření řešení založených na analytických službách (obr. 3).

Chcete-li vytvořit krychli OLAP, musíte se nejprve rozhodnout, jaká data ji vytvořit. Nejčastěji se OLAP kostky staví na základě relačních datových skladů se schématy hvězd nebo sněhových vloček (o nich jsme hovořili v předchozí části článku). Balíček SQL obsahuje příklad takového úložiště - databázi AdventureWorksDW, pro jejíž použití byste jako zdroj měli najít složku Data Sources v Průzkumníku řešení, vybrat položku kontextové nabídky Nový zdroj dat a postupně odpovědět na otázky příslušného průvodce ( Obr. 4).

Poté se doporučuje vytvořit Zobrazení zdroje dat, na kterém bude krychle vytvořena. Chcete-li to provést, musíte vybrat příslušnou položku místní nabídky ve složce Zobrazení zdroje dat a důsledně odpovídat na otázky průvodce. Výsledkem těchto akcí bude datové schéma, s jehož pomocí se sestaví reprezentace datových zdrojů a ve výsledném schématu lze místo původních specifikovat „přátelské“ názvy tabulek (obr. 5). .

Takto popsanou kostku lze přenést na server analytických služeb výběrem možnosti Deploy z kontextové nabídky projektu a zobrazením jejích dat (obr. 7).

Vytváření krychlí nyní využívá mnoho funkcí nové verze SQL Server, jako je například zobrazení zdroje dat. Popis zdrojových dat pro konstrukci krychle, stejně jako popis struktury krychle, se nyní provádí pomocí nástroje Visual Studio známého mnoha vývojářům, což je významnou výhodou nové verze tohoto produktu - tzv. studium nových nástrojů vývojáři analytických řešení je v tomto případě minimalizováno.

Všimněte si, že ve vytvořené krychli můžete měnit složení měr, mazat a přidávat atributy dimenze a přidávat vypočítané atributy členů dimenze na základě existujících atributů (obr. 8).

Rýže. 8. Přidejte vypočítaný atribut

Kromě toho mohou krychle SQL Server 2005 automaticky seskupovat nebo třídit členy dimenze podle hodnoty atributu, definovat vztahy mezi atributy, implementovat vztahy many-to-many, určovat klíčové obchodní metriky a mnoho dalšího (přečtěte si, jak Všechny tyto kroky lze nalézt v SQL Server Analysis Services Tutorial v nápovědě daného produktu).

V dalších částech této publikace budeme pokračovat ve zkoumání analytických služeb SQL Server 2005 a zjišťovat, co je nového v oblasti podpory dolování dat.

Výběr redakce
Milovat není tak snadné, jak se zdá, a žít po boku jiného člověka je ještě těžší. Proto mohu s klidem říci, že každé výročí...

Darujte svému milému dopis, ve kterém se něžná slova promění v jemné čáry s laskavým a jemným významem, s láskou a úctou, s duhou...

Ráno, odpoledne, večer a noc... Včera, dnes, zítra a vždy tě miluji! Dobré ráno zlato! Ať máte dnes úspěšný den...

Možná vás již napadlo, jak správně požádat o odpuštění, pokud jste udělali něco špatného. Jakými slovy začít, jak vyjádřit lítost...
Pozvání herců k pořádání kostýmovaných gratulací je mezi rodiči, kteří chtějí poblahopřát, již několik let žádané...
Zveme vás ke čtení citátů o životě. Zde jsou shromážděny fráze, aforismy, citace o životech skvělých lidí a obyčejných lidí. Mezi těmito citáty jsou...
Anna Sedokova je zpěvačka a herečka, televizní moderátorka, spisovatelka a režisérka. Upoutala pozornost a debutovala na hudební scéně v...
Jedná se o produkt čínských léčitelů, který nemá obdoby! Koncentrovaný přípravek používaný jako doplněk stravy a...
Novinářka poznamenává, že se 20. července probudila s podobnými pocity, jaké měla před 16 lety. Probudil jsem se v 5:30 a protáhl se...