Velká a malá data: Soukromá, či veřejná?

Podle otevřené profesní komunity Wikibon se příjmy z big dat na trhu se softwarem a službami celosvětově zvýší z letošních 42 na 103 mld. dolarů v roce 2027 a dosáhnou 10,88 procenta ročního růstu (CAGR). Naproti tomu Forrester pro letošek předpovídá trhu se softwarem velkých dat (bez služeb) 31 mld. dolarů. To dělá přes 10 procent celkového trhu softwarových aplikací (302 mld. dolarů).

Za nástroje pro big data zatím platí hlavně velké firmy - čtěte ZDE

Průzkum Accenture hovoří o 79 procentech topmanažerů, již jsou přesvědčeni o tom, že firmy, které se nezabývají problematikou velkých dat, jsou odsouzeny ke ztrátě svých tržních pozic, navíc mohou přímo čelit zániku. Celých 83 procent z nich usiluje o projekty na tomto poli pro získání konkurenční výhody.

Letošní zpráva McKinsey uvádí odvětví, kde jsou big data a pokročilá analytika největším přínosem. Jde o obchod a marketing, vědu a výzkum, logistiku a výrobní procesy. Tematika velkých dat je v současnosti zmiňována společně s umělou inteligencí a strojovým učením. To potvrzuje i průzkum PwC, v němž se lze dočíst o 59 procentech respondentů přesvědčených o tom, že využití velkých dat by se v jejich společnostech výrazně zlepšilo při nasazení AI.

Velká data pro všechny

Bude vzestup umělé inteligence a strojového učení vyvolaný velkými daty znamenat nevratnou nerovnost pro nástup inovací? Tuto otázku si v rozhovoru týdeníku The Economist klade známý veterán mezi investory (například Warburg Pincus) a autor několika knižních bestsellerů Bill Janeway, když popisuje způsob, jakým by přístup k big datům s podporou umělé inteligence mohl umožnit vybrané skupině firem inovovat rychlostí, o níž by ostatní mohli jen snít. Data se stávají nejcennějším světovým zdrojem - ropou 21. století a firmy geeků ze Silicon Valley nepřetržitě schraňující data od nás všech ovládly svět. Ti, kteří disponují hromadou dat, mají výhodu - i pokud jde o inovace.

Janeway to vysvětluje na příkladu firem, které dnes testují autonomní vozy a operují s obřím množstvím údajů pro vývoj té nejlepší inteligence pro řízení vozidel. Jakmile se zde objeví jasný lídr, bude jistě i premiantem v zásobení trhu samoobslužných vozů. Když to nastane, bude mít rovněž jako první k dispozici kvanta údajů z reálného provozu - a konkurence jej bude stěží dohánět.

Je vůbec některé z odvětví imunní vůči tomuto trendu? Kdokoli zpracuje ty nejlepší údaje jako první, bude schopen inovovat bezprecedentní rychlostí - na úkor svých konkurentů. Janeway říká: "Čím více dat, tím lepší jsou algoritmy. A čím lepší jsou algoritmy, tím lepší je kvalita služeb poskytovaných giganty typu Amazon, Facebook nebo Google," a pokračuje: "Nepopiratelnými zdroji tržní síly byly donedávna patenty (kde např. dominoval Xerox), síťové externality ve smyslu úspor z rozsahu (IBM) či vládní předpisy a franšízy (AT&T). Ano - i ve věku internetu budou tyto mít stále svou váhu. Ovšem strojové učení jako zdroj konkurenční výhody se stává dalším technologickým hybatelem, přičemž ty subjekty, jejichž nabídka dosáhne vedoucího postavení na trhu, budou zároveň schopny neustále zlepšovat a posilovat svou tržní pozici."

Rozhovor se též opírá o studii OECD, jež zmiňuje, že pět procent firemních celosvětových lídrů ponechává své soupeře v prachu - daleko za sebou. Schopnost těchto firem "vyluxovat" takové množství dat by mohla být potenciálně kompenzována, pokud by tato data bylo možné analyticky vytěžovat přes celou ekonomiku. Pokud by měli všichni rovný přístup k rostoucímu množství dat, stejně jako má každý podnik garantovaný přístup k elektřině, pak věk AI by mohl podnítit celosvětovou explozi inovací.

Francouzský ekonom Thomas Piketty ve svém bestselleru Kapitál v 21. století pro kontrolu nerovnosti navrhuje celosvětovou daň z majetku. Nemělo by něco podobného platit i pro big data? ptá se Janeway.

Vytvoří velká data, posílená umělou inteligencí, stále se zvětšující propast mezi několika elitními podniky, které je mají k dispozici, a zbytkem světa? Neměla by tato data, k jejichž tvorbě přispíváme my všichni, být veřejně dostupná? A pokud ano, jak podpořit ty, kteří si je budou chtít stáhnout a dále zpracovat?

Slepá víra v inovace přes Excel

Zcela opačný názor k této problematice publikoval jiný renomovaný server. Kdy jste naposledy slyšeli zářný inovativní příběh začínající sdělením: "Heuréka, přišel jsem na to pečlivým zkoumáním excelových tabulek!" - ptá se mediální portál Quartz v článku Data by neměla řídit veškerá vaše rozhodnutí. A hned úvodem vypráví příběh dvou zakladatelů Airbnb, Gebbia a Cheskyho, které majitel známého startupového inkubátoru Y-Combinator, Paul Graham, hned v počátku jejich podnikání vyzval k opuštění Silicon Valley a přesunu do New Yorku - místa s největším tržním potenciálem pronájmu apartmánů. A to z jednoduchého důvodu, aby se tu podělili se svými zákazníky o jejich zkušenosti. Tak se tito dva velmi rychle dozvěděli o třech zásadních úskalích bránících dalšímu firemnímu růstu - neatraktivnosti snímků nabízených nemovitostí, uživatelské nepřívětivosti webových stránek a nepříjemných pocitech klientů při placení v hotovosti z ruky do ruky.

Pokud by se Chesky a Gebbia šťourali ve statistikách z různých měření a průzkumů, skončili by pravděpodobně u nabídky bytů v řadových zástavbách příměstských čtvrtí pro rodiny střední třídy s 2,3 dětmi. To je pouze jeden z mnoha podnikatelských příkladů materializujících drobná data pro velká rozhodnutí. Zásadní podnikatelské postřehy spočívají dle Quartzu v neotřelých zákaznických příbězích - nikoli v hladké předvídatelnosti statistických korelací z průzkumů. Ty totiž neodhalují zásadní věc, jež je nejdůležitější pro inovativní nápady - ono "proč" za rozhodnutím zákazníka nakoupit a používat konkrétní produkt.

Vypovídající schopnost velkých dat umožňujících průlomy v mnoha aspektech manažerského a vědeckého úsilí je uctívána s takovou okázalostí, že dala vzniknout až náboženské víře ve své možnosti. Stačí získat dostatek dat a informací - a pravda vyjde najevo. Tato víra je však slepá.

Malá, ne velká data a příběhy zákazníků

Inovativní vhledy vyžadují malá, ne velká data, tvrdí dále Quartz. Všechna big data jsou generována lidskou činností a představují jenom sterilizovanou výpověď nepořádku našich životů. Opravdoví inovátoři se chaosu nevyhýbají. Naopak, ponoří se do něj, aby odkryli jeho bohatý význam.

42 mld.

Příjmy z big dat na trhu se softwarem a službami se celosvětově zvýší z letošních 42 na 103 mld. dolarů v roce 2027 a dosáhnou 10,88 procenta ročního růstu (CAGR).

Zdroj: Wikibon

59 %

Takové množství respondentů je podle průzkumu PwC přesvědčených o tom, že využití velkých dat by se v jejich společnostech výrazně zlepšilo při nasazení umělé inteligence.

Skutečně užitečná data k nám přicházejí ve formě příběhů, nikoli statistik. Reálné životní příběhy jsou rudou, v níž lze nalézat zlaté nugety. Extrémní hodnoty jsou cennější než průměry. Analytický software má tendenci prezentovat skutečné životní situace přes uhlazené, zprůměrované hodnoty, kde jsou extrémy brány jako pouhý šum, zkreslení. Přes průměrné náhledy se ale lze jen stěží dostat k inovativním nápadům. Ty se skrývají právě v anomáliích - v něčem neočekávaném.

Zakladatel softwarové firmy Intuit, Scott Cook, zmiňuje podobnou zkušenost s odzbrojující zpětnou zákaznickou vazbou, jež od základu změnila jeho myšlení o podnikovém účetním softwaru pro malé firmy. "Co jsme si uvědomili, je to, že účetní software je tou poslední věcí na světě, kterou majitelé malých firem chtějí. Celé účetnictví jim je ukradené nebo jim nahání strach. To, co chtějí, je rozvíjet své podnikání a neupadnout do dluhů. Nechtějí lepší účetní nástroje, chtějí pouze, aby účetnictví úplně zmizelo." Pro Intuit byl tento náhled silnou výzvou: Jak navrhnout tak dobrý účetní software, aby své uživatele zbavil účetnictví?

Veřejný a soukromý prospěch

Britský Guardian se zase zabýval klesající důvěrou veřejnosti k statistikám zpracovávaných erudovanými nezávislými institucemi a jejich v oboru vystudovanými experty a přechodem k novému věku velkých dat spravovaných geeky z privátních společností - nezřídka přímo ohrožujících demokracii. Příkladem budiž analytická firma Cambridge Analytica a její spolupráce s Facebookem při ovlivňování posledních amerických prezidentských voleb či brexitu.

Z dlouhodobého hlediska budou důsledky tohoto problému pravděpodobně stejně hluboké, jako byl nástup statistických metod koncem 17. století. Vzestup velkých dat poskytuje mnohem větší možnosti pro kvantitativní analýzu než jakékoli množství hlasování nebo statistického modelování. Nejde však pouze o množství zpracovávaných údajů. Představuje zcela odlišný typ znalostí, doprovázený novými profily odbornosti.

Tradičně statistici vědí, na jaké otázky se chtějí ptát, a následně vyberou vzorek populace pro jejich zodpovězení. Na rozdíl od toho digitální data jsou vytvářena automaticky. Vždy když použijeme věrnostní kartu, píšeme na Facebook, telefonujeme nebo vyhledáváme na Googlu. V tomto novém světě šmírování jsou nejprve zachycena data a výzkumné otázky přicházejí později.

Anonymita a tajemnost soukromých průzkumů obestřených mlčením, protože není důvod je veřejně sdílet - spíše naopak -, je děsivá. U komerčně shromažďovaných velkých dat neexistuje žádný ekvivalent Úřadu pro národní statistiky. Žijeme ve věku, kdy naše chování, pocity, identity a vztahy lze sledovat a analyzovat s nebývalou rychlostí a citlivostí, ale žádná striktní pravidla, která by tuto novou aktivitu zakotvila ve veřejném zájmu nebo ve veřejné diskusi.

Například Google či Facebook mají možnost provést kvantitativní průzkumy stovek milionů profilů za velmi nízkou cenu. Mají však velmi málo podnětů ke zveřejňování výsledků.

Využití big dat, příklady z podnikové praxe

Pokud sestoupíme o několik pater níže a podíváme se na využívání velkých dat ve firemním prostředí, snadno se přesvědčíme, že inteligence obsažená v datech může velmi dobře posloužit zkvalitnění zákaznických služeb.

Jedna z největších přepravních a logistických společností na světě, UPS, monitoruje denně údaje o 16,3 mil. zásilkách pro 8,8 mil. zákazníků, s denním průměrem 39,5 mil. zákaznických žádostí ohledně stavu jejich balíčků. Společnost ukládá a zpracovává více než 16 petabajtů dat.

Poskytovatel široké škály přepravních služeb US Xpress shromažďuje kolem tisíce datových prvků ze své flotily vozidel - od spotřeby paliva přes aktuální stav pneumatik až po polohové GPS údaje, jež využívá pro optimální řízení vozového parku a zvýšení produktivity přes mnohamilionové úspory v nákladech.

Americký Sprint, který na globální úrovni poskytuje internetové služby 53 milionům zákazníků a denně vyhodnotí desítky miliard transakcí, dokáže zvýšit kapacitu svých sítí o celých 90 procent. A to především díky nasazení rozsáhlé analýzy dat v reálném čase, jež dramaticky navyšuje inteligenci celé sítě a následně zajišťuje její správu a kontrolu.

Řetězec Wall-Mart zase vsadil na textovou analýzu, strojové učení a třeba i na dolování synonym, a to pro zlepšení výsledků vyhledávání na svých webových stránkách. Progres v sémantickém vyhledávání zlepšil on-line nakupování jejich zákazníků o 10 až 15 procent, což v podmínkách tohoto retailového obra představuje miliardy dolarů.

Anketa: Realizované big data projekty

Můžete uvést nějaký příklad využití big dat z praxe?

Martin Bosák, solution architect, Billigence

Aktuálně bych zmínil dva příklady projektů - v jednom jsme pomohli nadnárodnímu holdingu vytvořit tzv. data market place na data z různých oblastí napříč odvětvími (telco, retail, finance) pro účely pokročilé analýzy. Klientovi jsme pomáhali nalézat use cases, efektivně data spojovat a získávat z nich nové informace.

Ve druhém případě šlo o zákazníka z oblasti telekomunikací, kde jsme řešili off-loading již nevyhovujícího přeplněného datového skladu na big data plaftormu. Ta umožnila ušetřit náklady na datový sklad, zpracovat výrazně větší množství dat, urychlila práci s nimi a zpřístupnila je širšímu množství uživatelů.

Lukáš Kovárník, manažer rozvoje ICT řešení, T-Mobile

Jako příklad řešení a analýzy mobility z praxe je možno uvést statutární město Brno. Město využívá analýzy od T-Mobilu pro různé účely, ať už je to efektivní plánování a řízení turistického ruchu, plánování územního rozvoje, nebo optimalizace MHD. Kromě jiného právě v Brně vzniká i veřejný portál, který tato data ukazuje veřejnosti, zejména pak Brňanům.

Další ukázkou využití big dat v oblasti cestovního ruchu je pilotní analýza počtu a struktury domácích a zahraničních návštěvníků a turistů v Národním parku Šumava. Cílem tohoto šetření bylo změřit a popsat denní a celkový počet návštěvníků/turistů na Šumavě, jejich základní charakteristiky a následně navrhnout doporučení pro zlepšení parametrizace měření návštěvnosti pomocí geolokačních dat ze sítě T-Mobilu.

Jiří Bohuslav, managing consultant, team leader DWH, partner, Sophia Solution

Každý dnes chce mít big data platformu, protože jsou fenoménem dnešní doby, ale jak praxe ukazuje, ne každý má tak velká data, aby realizace takového projektu byla opodstatněná. Dle mého názoru není v České republice tolik firem, které by opravdová big data řešení potřebovaly. Ovšem oblasti, kam bezpochyby patří, jsou telekomunikace, banky, pojišťovny, velké e-shopy, obecně řešení pro e-commerce. Sophia Solutions působí u významného telekomunikačního operátora, kde se naši konzultanti podílejí na projektu big data platformy (enterprise Hadoop clusteru) v oblasti architektury řešení, realizace funkčních požadavků s cílem zpřístupnit řešení pro marketingové účely, pro účely monitoringu sítě a přípravu dat pro tým scientistů.

Článek a anketa byli publikovány v magazínu ICT revue.

Přidejte si Hospodářské noviny mezi své oblíbené tituly na Google zprávách.

Tento článek máteje zdarma. Když si předplatíte HN, budete moci číst všechny naše články nejen na vašem aktuálním připojení. Vaše předplatné brzy skončí. Předplaťte si HN a můžete i nadále číst všechny naše články.

Veškerý obsah HN.cz
Mobilní aplikace
Bez reklam
Odemykejte obsah pro přátele
Články v audioverzi + playlist
Možnost kdykoliv zrušit

za 80 Kč s mobilní aplikací
a bez reklam nebo za 40 Kč bez mobilní aplikace
a s reklamou

Velká a malá data: Soukromá, či veřejná?

Martin Bosák, solution architect, Billigence

Lukáš Kovárník, manažer rozvoje ICT řešení, T-Mobile

Jiří Bohuslav, managing consultant, team leader DWH, partner, Sophia Solution

Tento článek máteje zdarma. Když si předplatíte HN, budete moci číst všechny naše články nejen na vašem aktuálním připojení. Vaše předplatné brzy skončí. Předplaťte si HN a můžete i nadále číst všechny naše články.

Související články

Čeští datasapiens expandují do Norska

Cloudové řešení SAP Sports One umožní sportovním klubům analyzovat velká data

Na velikosti záleží

Veeam představil vizi mimořádně dostupného podniku a strategii komplexní platformy pro inteligentní správu velkého objemu dat

Datová centra 2018: Individuální služby a vysoké zabezpečení

Žadatelé zahltili dotační portál, ten kvůli náporu zkolaboval. Další výzvy teď ministerstvo nepřijímá

Žadatelé zahltili dotační portál, ten kvůli náporu zkolaboval. Další výzvy teď ministerstvo nepřijímá

Vybíráme z HN

Netflix zvýšil zisk i tržby, výhled pro další čtvrtletí je ale pod očekáváním. Akcie firmy reagovaly poklesem

Drsné útoky Andreje Babiše na Petra Pavla svědčí o jediném: Chce proti němu kandidovat a napodruhé se dostat na Hrad

Umělá inteligence mění práci i trhy. Tohle musí vědět ti, kteří nechtějí skončit jen jako uživatelé

Velká a malá data: Soukromá, či veřejná?

Martin Bosák, solution architect, Billigence

Lukáš Kovárník, manažer rozvoje ICT řešení, T-Mobile

Jiří Bohuslav, managing consultant, team leader DWH, partner, Sophia Solution

Tento článek máteje zdarma. Když si předplatíte HN, budete moci číst všechny naše články nejen na vašem aktuálním připojení. Vaše předplatné brzy skončí. Předplaťte si HN a můžete i nadále číst všechny naše články.

Zaujal vás článek? Pošlete odkaz svým přátelům!

Vyberte způsob sdílení

Související články

Vybíráme z HN