Přejdi na obsah Přejdi na navigaci
 

Self-servis mýtus

Doprovodný obrázek

Self-service BI nástroje jako Tableau, QlikView, Microsoft PowerBI a další zažívají velký rozmach. Umožňují lidem z byznysu, aby sami bez hlubších technických znalostí jednoduše analyzovali svá data a vytvářeli reporty a vizualizace, na které předtím – když je chtěli od IT – museli čekat měsíce. Osobně to považuji za skvělé, těmto nástrojům fandím a intenzivně zvažujeme, který z nich (kromě Microsoft BI, které už implementujeme) bychom měli přidat do portfolia podporovaných technologií.

Dodavatelé těchto nástrojů ale zároveň ve snaze prodat co nejvíce licencí šíří podle mě poměrně nebezpečný mýtus, že analýza dat a reporting je díky nim tak jednoduchá, že vlastně není zapotřebí IT a už vůbec ne něco jako datový sklad. Než však člověk podlehne přemíře nadšení, je dobré hlouběji se zamyslet nad tím, jak jsou self-service BI nástroje standardně prezentovány:

„Dobrý den, rád bych vám ukázal, jak si díky <doplňte název produktu> můžete sami velmi snadno analyzovat data bez zapojení IT. Abychom se nezdržovali, mám tady data připravená v CSV, sem si je přetáhnu a..“. Následuje ukázka rychlé tvorby tabulek, grafů, reportů, dashboardů a všeho, po čem byznys touží a v čem jsou tyto nástroje opravdu skvělé a užitečné.

V celém procesu ale trochu zaniká poměrně zásadní otázka – kde se ta data připravená v CSV vlastně vzala? V žádné z firem, se kterými jsem se zatím setkal, se čistá, kvalitní data konsolidovaná z několika systémů v CSV nikde nepovalují. Ta největší práce – standardně se uvádí cca 70% pracnosti BI projektů – spočívá právě v tom, jak data lokalizovat ve zdrojových systémech (viz můj článek Čí jsou ve skutečnosti vaše data?), dostat je z nich ven, spojit je dohromady, vyčistit, historizovat a uložit je v takovém formátu, aby jim uživatelé rozuměli a mohli je – třeba právě pomocí nástrojů pro self-service BI – jednoduše reportovat a analyzovat. K tomu slouží právě datový sklad a zatím jsem se nesetkal s ničím, co by jej v tom mohlo nahradit.

Typickými úlohami, které se na úrovni analytických nástrojů řeší jen velmi těžko, jsou třeba:

  • Unifikace klientů, produktů a dalších informací z různých systémů. I kdyby se na úrovni reportu či analýzy udělat dala, jde o velmi pracný proces, který je pak s každým dalším reportem nutný opakovat. V případě 3 a více systémů je to pak podle mého názoru realizovatelné jen velmi těžko.
  • Alokace nákladů, která většinou vyžaduje daleko složitější algoritmy, než jaké je možné snadno vytvořit v analytickém nástroji.
  • Čištění dat a řízení jejich kvality. Datový sklad standardně obsahuje mechanismy, které by na chyby v datech měly upozornit a umožnit je řešit, zatímco BI nástroj většinou pouze vrátí špatné výsledky.
  • Vícenásobné (N:N) vazby, které v generovaném SQL dotazu způsobují vícenásobné započítání některých záznamů (např. pokud máme slevu na úrovni faktury, ale částku počítáme z jednotlivých položek faktury, má sleva tendenci započítat se tolikrát, kolik je položek).
  • Prakticky cokoliv, co vyžaduje složitější skriptování a algoritmy.

V jednodušších případech může jako alternativa sloužit in-memory databáze integrovaná s analytickým nástrojem, jako je například QlikView. I zde se ale fakticky jedná o vytvoření jakéhosi datového skladu, jen v jiné než klasické relační databázi, a to za pomocí skriptů vyžadujících solidní IT znalosti. Je pak navíc potřeba počítat s tím, že data budou přístupná POUZE pomocí daného nástroje, což může do budoucna znamenat nemalé náklady na další licence a případně velmi nákladný přechod na jinou technologii.

Myslím, že spíše než na to, jak se vyhnout budování datových skladů, by se měly firmy zaměřovat na to, jak je budovat:

  • S co nejmenšími náklady.
  • Tak, aby dokázaly co nejrychleji reagovat na změny.
  • Aby bylo pro uživatele co nejjednodušší dostat z nich data a případně je zkombinovat se svými Excely nebo jakýmikoliv externími daty.
  • Univerzálně použitelné jako zdroj pro jakýkoliv reportingový nebo analytický nástroj.

K dosažení těchto cílů je možné využít řady technik od dimenzionálního modelování, agilních metodik vývoje, budování sandboxů a dalších. V případě zájmu si s vámi o těchto technikách rádi popovídáme, podělíme se o naše zkušenosti a poradíme, jak je úspěšně aplikovat ve vaší firmě.

autor: Jakub Holubec

 

 

INSPIRACE do Vašeho e-mailu

Pozvánky na kurzy a konference, newslettery se zajímavým obsahem, články na aktuální témata, nejnovější trendy. Teď už Vám nic neunikne. Ochrana osobních údajů.

*
*
*