Budoucnost dat a analytiky je rozšířená

Budoucnost dat a analytiky je rozšířená

Lukáš Erben

Ve světě analytiky, BI a datové vědy se zjevilo nové paradigma: rozšířená analytika (augmented analytics). Jejím srdcem, nebo spíše mozkem, je automatizace využívající strojové učení s cílem poskytnout lidem kontextuální povědomí napříč celým datově-analytickým workflow, tedy od dat přes jejich pochopení po rozhodnutí a akci.

Rozšířená analytika bude podle analytiků (kdo jiný by jí měl rozumět) klíčem k objektivnímu rozhodování a nestrannému vnímání souvislostí – promění způsob, jakým uživatelé pracují s daty, jak je spotřebovávají či využívají a jak na základě zjištění z nich vycházejících konají.

Ještě stále jsme vás notnou dávkou klišé a kýčovitostí úvodních dvou odstavců neodradili? To jedobře. Rozšířená analytika totiž skutečně zásadně mění to, jak organizace – a zejména jejich řadoví zaměstnanci – pracují s daty. Prohlásit, že „objem a variabilita dat rostou a jejich využití pro optimalizaci digitálního rozhodování jdoucí napříč podnikovými doménami se stává velmi složitým“, sice zní jako další
klišé, ale je to pravda. Dat, která podnik a jeho zákazníci generují, je zatraceně moc a díky fenoménům,
jako jsou appky, lokační data, interakční a transakční data z webu nebo třeba data z různých připojených
zařízení, roste nejen jejich objem, ale i vzájemná provázanost a množství souvislostí, které
lze nacházet a zkoumat.

A zvládnout něco takového „ručně“ pomocí dosavadních postupů se stává velmi nepraktickým – zejména chcete-li výstup nejlépe hned, a ne až za pár hodin, dnů nebo týdnů. Při rozhodování se tak místo dostupných dat a přesných analytických výstupů používají spíše odhad a selský rozum. To je řešení rychlé, efektivní, ale poněkud subjektivní. Manažeři, a dokonce i daty ošlehaní analytici, tak mnohdy zkoumají své vlastní, často zcela domnělé hypotézy, přehlížejí klíčová zjištění či souvislosti a docházejí
k nesprávným nebo neúplným závěrům. Řešením nebývá ani najmutí špičkových datových vědců
(kteří dokážou sestavit správné modely a vyhnout se většině tradičních úskalí) – jednoduše proto,
že jsou sice pekelně drazí, ale zato na trhu nejsou. Nicméně nezoufejte, stačí se v klidu posadit a s úlevou vydechnout:

Rozšířená analytika

Zrodila se, jak už to dnes bývá, především ve světě start-upů, cestou akvizic si ale postupně nachází cestu do tradičních BI a analytických portfolií velkých dodavatelů. Mezi takové patří BeyondCore (zbaštěno Salesforce již v roce 2016 a přejmenováno na Salesforce Einstein Discovery)
nebo DataRobot, v našich luzích a hájích pak Stories, které se prezentovaly na Gartner Data
& Analytics Summitu v březnu 2018 (aby je o čtvrt roku později pozřela americká společnost Workday).
Do sféry rozšířené analytiky patří ale i původní tvorba velkých hráčů – zejména IBM Watson
Analytics. Fenomén rozšířenosti postihuje také oblast platforem pro samoobslužnou přípravu dat,
kde firmy jako Paxata, Trifacta nebo UniFi také nasazují techniky typu strojového učení. Co vše tedy
přesně rozšířená analytika zahrnuje, nebo spíše zahrnovat bude? Podle analytiků se totiž jejího masového rozšíření dočkáme v horizontu dvou až pěti let, tedy do roku 2023.

Rozšířená příprava dat (augmented data preparation) využívá strojové učení k automatizaci
a zlepšení profilace dat a datové kvality, harmonizace, modelování, manipulace,
obohacování, tvorby metadat a katalogizace.

• Rozšířené zkoumání dat (augmented data discovery, dříve chytré zkoumání dat – smart
data discovery) umožňuje řadovým zaměstnancům a civilním datovým vědcům používat strojové učení pro automatické vyhledání, vizualizaci a slovní popis relevantních zjištění (korelace, výjimky, clustery, spojitosti a předpovědi), aniž musejí sami vytvářet modely nebo psát algoritmy. Uživatelé zkoumají data pomocí vizualizace, vyhledávacích nástrojů a dotazů v přirozeném jazyce a odpovědi získávají v obrazové formě nebo formou popisu v přirozeném jazyce (narration). Znamená to, že rozšířené zkoumání dat mohou efektivně používat civilní datoví vědci, aniž je třeba vytvářet hypotézy či prototypy a ručně „experimentovat“. Zkušení datoví vědci (profesionálové) tak mohou svůj čas plně věnovat tvorbě a zprovozňování komplexnějších datových modelů.

• Rozšířená datová věda a strojové učení (augmented data science and machine learning) umožňují automatizovat některé klíčové prvky pokročilého analytického modelování, jako je výběr parametrů. To opět snižuje potřebu zkušených a vyškolených specialistů při tvorbě, zprovoznění a správě pokročilých analytických modelů. Řada automaticky tvořených a následně lidmi dotvářených modelů využívajících strojové učení (vzniklých rozšířenou analytikou) bude také vkládána do podnikových aplikací. Půjde zejména o oblasti, jako HR, finance, prodej, marketing, zákaznické služby, nákup a správa aktiv (takže vlastně téměř všechna oddělení), kde je budou moci využívat všichni zaměstnanci, nejen analytici a datoví vědci.

Rozšířená analytika se také stane klíčovou funkcí konverzační analytiky – jde o další významné paradigma, které nahrazuje tradiční rozhraní aplikací (menu, programované dotazy apod.) prostým kladením otázek v přirozeném jazyce (ať už formou psaného textu nebo hlasem) například prostřednictvím mobilního zařízení a osobních asistentů. V praxi by to mohlo vypadat tak, že namísto zobrazení denního dohledového panelu (dashboardu) se vedoucí pracovník zeptá zařízení s VA typu Amazon Alexa „Alexo, udělej analýzu prodejních výsledků za poslední tři měsíce!“ nebo „Alexo, jaké tři hlavní věci mohu ihned udělat pro zvýšení počtu uzavřených kontraktů?“.  

To je ale spíše hudba (nepříliš vzdálené) budoucnosti. Konverzační analytika zatím není součástí
standardních analytických a BI řešení a první praktické experimenty měly často k dokonalosti daleko.
V první fázi budou nejspíš tyto funkce dostupné prostřednictvím API (mezi analytickým řešením
a virtuálním asistentem), postupně se ale dočkáme i integrované podoby, kterou bude jednodušší nasadit. Analytici odhadují, že běžnou součástí hotových podnikových řešení se „konverzační analytika“ stane během dalších dvou až pěti let – tedy do roku 2023.

Tento článek je úvodní částí tématu z INISIDE Report 2018 - 2 (ročník 19, číslo 2), český text vychází ze studie Gartner "Augmented Analytics is the Future of Data and Analytics" G00375087