Šéf datového týmu CNC: Na datech stavíme doporučovací algoritmy i nové tituly. Konečně víme, kdo je naše publikum
Jak se může mediální dům transformovat a začít dělat rozhodnutí založená především na datech? Aby se tak mohlo stát, je potřeba udělat zásadní změny a vzít to od podlahy. Vedení CNC se v návaznosti na proces transformace, kterým prochází, rozhodlo vybudovat zbrusu nové Business Intelligence oddělení, které relevantní data nejen sbírá a analyzuje, ale zároveň pomáhá zaměstnancům dalších oddělení se v nich orientovat. V jeho čele stojí Jakub Šiler, obsahový analytik s přesahem do sociologie a marketingu, který se rozhodně nebojí výzev. V rekordním čase dokázal postavit hvězdný tým a určit mantinely měření pro celé vydavatelství. Nám v rozhovoru vysvětluje, co všechno se dá dnes z dat vyčíst a jak to mění práci lidí v mediálním domě.
Business Intelligence má rozmanité interpretace. Jak byste ji popsal vy, třeba někomu, kdo o ní slyší poprvé?
Představte si, že máte obrovské množství dat – z onlinu, z printu, z inzerce, finanční data nebo informace o tom, kdo si předplácí jaké časopisy. Kouzlo BI týmu je v tom, že dává všechna tahle data dohromady a v kontextu získaných informací dává doporučení týmům, které s nimi pak pracují. Ať už jsou to redakce, marketing, obchod, nebo vedení obecně.
Jaké základní předpoklady jsou potřeba k tomu, aby se organizace mohla stát „data-driven“?
Prvním předpokladem je odhodlání. To bylo splněno v osobě Juraje Felixe (Co-CEO CNC, pozn. red.), který rozhodl, že pokud máme dělat digitální transformaci, potřebujeme data, abychom se měli na základě čeho rozhodovat. Sekundárně je potřeba do toho jít naplno. Nemůžete se rozhodnout, že budete dělat data-driven přístup, ale zároveň si říct, že nemáte peníze na kvalitní nástroje a schopné lidi. Dalším předpokladem je i to, že koncoví uživatelé datům rozumějí a umějí se podle nich rozhodovat. A to není jednoduché ve firmě, která na to nebyla zvyklá. Vyžaduje to kontinuální práci, aby lidé data dokázali sami číst.
Už jste to vlastně trochu nakousl, ale je tady namístě se zeptat – jaké největší výzvy stojí před Business Intelligence oddělením v tak rozsáhlém a komplexním mediálním domě?
Velká výzva je v tom, že všechno probíhá poměrně rychle. Sbíráme pořád víc dat a vytváříme pořád víc reportů, ale trochu předbíháme přirozený postup, kdy mají lidé čas se na ten proces adaptovat. Ideálně jsou při takové datové transformaci v každém oddělení (třeba v redakci) takzvaní data šampioni – tedy lidé, kteří datům stoprocentně rozumějí a mohou je předávat kolegům. My, abychom to urychlili, tyhle lidi najímáme přímo do našeho týmu. V případě redakcí jim říkáme obsahoví analytici a většina z nich přišla ze sociologického odvětví. Mají tedy méně technické kompetence, ale zato větší přesah do komunikace s lidmi. Ti mají za úkol bavit se s redaktory, data jim překládat a tím jim celou transformaci usnadňovat.
Datový tým CNC jste postavil prakticky od nuly. Kde a podle jakých kritérií jste nové kolegy hledali?
V první řadě jsem hodně čerpal ze svých bývalých týmů. V případě obsahové analytiky pro mě totiž bylo hodně důležité, aby ti lidé od prvního dne věděli, co mají dělat. Mezi prvními jsme taky vzali člověka na datovou architekturu, protože ta se nedá dělat salámovou metodou, ale musí se dopředu rozmyslet, jak budou data strukturovaná a jaké nástroje se budou používat. No a pak jsme to postupně nabalovali. Teď je nás zhruba 20.
Je potřeba jít do toho naplno. Nemůžete dělat data-driven přístup, ale zároveň si říct, že nemáte na kvalitní nástroje a schopné lidi.
Co byl váš první úkol? Na čem tak rozsáhlé měření pro velké vydavatelství vlastně začíná?
Z hlediska sběru dat jsme okamžitě začali implementovat nové měření na weby – Google Analytics 4 – abychom měli informace v co největším možném detailu. Do našeho příchodu společnost využívala jen bezplatnou verzi Google Analytics, která je pro naše potřeby nedostačující. Z hlediska obsahu jsme museli udělat analýzu trhu. Rozdělili jsme si českou společnost podle zájmů. Například: o historii se v Česku zajímají tři mil. lidí, o auto – moto další tři miliony. Tato data jsme propojili s tím, jaký zásah máme v jednotlivých tématech v printu i v onlinu. Díky tomu jsme zjistili, že si některé naše tituly konkurují, zatímco pro jiné skupiny nemáme nic adekvátního. Typicky pro mladé nebo vzdělanější publikum. To je první příklad, kde jsme museli zkombinovat data, abychom se vůbec rozhodli, jak vykročíme a co budeme dělat dál.
Jak tým funguje dnes? V čem spočívá jeho každodenní práce?
Dnes máme pět malých týmů. Jeden se věnuje webové analytice a je zodpovědný za všechno, co se sbírá na internetu. Nasazuje scripty, aby se požadovaná data měřila, a pak je vizualizuje do reportů. Druhý tým je zmíněná obsahová analytika, tedy lidé, kteří mají za úkol servisovat redakce a vysvětlovat jim, co a proč tým webové analytiky vlastně dělá. Třetí skupina se stará o technologickou část (jako je už zmíněná datová architektura) a zajišťuje, aby vše fungovalo automatizovaně. Čtvrtý tým se věnuje printu a marketingu. A pak je tu ještě jeden tým, který je ale tak trochu bokem. To jsou datoví žurnalisté.
Pojem „datová žurnalistika“ se v posledních letech používá často, není ale jisté, že všichni vědí, jaký je jeho obsah. Co je tedy úkolem datového žurnalisty v médiích?
Datoví žurnalisté primárně pomocí analýzy dat a jejich vizualizací přinášejí nové postřehy do tradičně pokrývaných témat, jako jsou fotbalová utkání nebo třeba volby. Zároveň však pomáhají čtenářům interpretovat a dávat do kontextu čísla, která v této době čím dál víc a častěji proplouvají veřejným prostorem. Příkladem může být vývoj inflace, ceny na burze nebo odlišnosti metodologie předvolebních průzkumů jednotlivých agentur, které dokážou objasnit, proč se různé prognózy liší zrovna tím daným způsobem.
BI odvětví je tedy z velké části o sběru a efektivním nakládání s daty. Přes jaké kanály, respektive jakým způsobem je v CNC sbíráte?
V printu pořád funguje osvědčený model sociologického výzkumu. Ptáte se obrovského množství lidí, jaký si kupují print, to pak kombinujete s prodejními daty a na základě toho se odhaduje čtenost. Protože jeden výtisk si taky může přečíst třeba deset lidí. V onlinu je to jednodušší. Nasadíte skripty, řeknete si, co se má měřit – například kolik procent lidí doscrolluje alespoň do tří čtvrtin článku – a to se měří. Z dat pak uděláme vizualizaci, ze které mohou redaktoři vyčíst třeba to, jak dlouhé by měli psát články.
Dále využíváme celou řadu interních systémů, díky nimž stavíme pro každé oddělení tzv. systém řízení výkonu, abychom věděli, jak je které oddělení efektivní. Každé z nich má vlastní cíle, ale je velmi důležité, aby se s ostatními odděleními vzájemně doplňovala. Když uvedu jednoduchý příklad, marketing má za cíl přivést čtenáře na web, redakce má za cíl čtenáře na webu zaujmout a udržet, inzerce má za cíl každou návštěvu dobře monetizovat. Díky tomu také můžeme vidět, který obsah na sebe vydělá a který ne.
To ale určitě není všechno, co se díky těmto datům můžete dozvědět o čtenářích, respektive o uživatelích jednotlivých titulů.
To určitě ne. U printu jsou to sociodemografické otázky (pohlaví, vzdělání, věk), které se pak spojují s celospolečenskými zájmy. Příklad: víme, kolik žen je každý rok na mateřské, a víme, že pro ně máme určitý časopis. Odpovídá jeho obsah jejich zájmům, nebo ne? V onlinu, tedy ve webové analytice, se typicky zkoumá, jak se lidé pohybují po webové stránce, jaké mají zájmy, jaké rubriky a témata čtou. To velmi dobře pomáhá určit, jaké rubriky mají na stránce být. Často se totiž dělají kategorie spíš od stolu, ale lidé se pak chovají úplně jinak. U všech webů také sledujeme velikost loajálního publika a analyzujeme třeba to, jestli se vyplatí soustředit se výhradně na toto loajální publikum a obsah přizpůsobit jeho zájmům, nebo je naopak lepší zaměřit pozornost na uživatele s nižší frekvencí návštěv, kteří na naše weby chodí nahodile, když na internetu vyhledávají konkrétní témata.
CNC není printové vydavatelství, ale producent obsahu. Musí se proto měnit podle potřeb člověka.
A co to přináší čtenářům? Poznám já jako čtenář, že je můj oblíbený titul data-driven?
Ano poznáte. Dobrým příkladem je Netflix – pokud funguje dobře, měl by vám doporučovat obsah, který vás zajímá. To jsou ale doporučovací algoritmy, které my v týmu neřešíme. U nás děláme analýzy ex post pro dlouhodobější rozhodování o tom, jakou strategií se daný titul vydá. Doporučovací algoritmus je naproti tomu živý organismus, který funguje okamžitě, v reálném čase.
Není v rámci žurnalistiky problematické, že lidé stejně jako na sociálních sítích vidí jen to, co vidět chtějí?
Facebook měl před časem snahu namíchat sociální bubliny jiným obsahem, což mělo vztah zejména k volbám. Bohužel se ukázalo, že lidé obsah, který odporuje jejich přesvědčení, buď ignorují, nebo ho neberou vážně. Takže na sociálních sítích to nabourávání úplně nefunguje. V médiích se to řeší tak, že čtenář nikdy nedostane 100 procent doporučeného obsahu – většinou má první místo redakční výběr toho nejdůležitějšího a až nižší pozice homepage se obsazují na základě doporučovacích algoritmů. Ty mohou být optimalizované na prokliky, nebo třeba na čas strávený na stránce.
Jakou roli v tom hraje umělá inteligence?
Umělá inteligence, to jsou de facto také algoritmy, které dokážou samy sebe učit – to je ta jejich inteligence. I zmíněné doporučovací algoritmy se vlastně učí, co na čtenáře funguje, a to jim pak nabízejí. V tomto směru AI používáme. Nedá se ale říct, že by to bylo na denním pořádku v našem týmu. Je ještě hodně daleko, aby umělá inteligence přemýšlela jako člověk, proto vás v mediálním oboru data ani AI nespasí. Potřebujete vždy lidskou intuici a zkušenost, zejména v obsahu.
Práce s daty se nicméně netýká pouze redaktorů, ale i ostatních oddělení napříč CNC. Pro jaké další obory se dá sběr dat využít?
Například e-commerce platformy, kde jsme ale zatím docela v plenkách, protože jsme se soustředili primárně na obsah. Pak je to marketing, distribuce v printu, část věcí děláme pro finance, část pro obchod. Řekl bych, že jsou to nakonec skoro všechna oddělení.
Jak mohou být data užitečná pro obchod?
Jako mediální dům máme výhodu, že dokážeme pokrýt téměř všechny cílové skupiny. A BI oddělení umí obchodu popsat konkrétní „cílovky“ jednotlivých produktů: pokud chcete cílit na mladé ženy, zaměřte se na tento titul, pokud na kutily, inzerujte v tomto titulu. S tím souvisí i crossmediální propozice, kdy dokážeme proměřit, jaký vliv má, když se inzerce nasadí zároveň do printu, onlinu a do televize. A jak se formáty dohromady doplňují. Navíc se snažíme obchodníkům automatizovat tvorbu analýz pro konkrétní inzerenty nebo jim doporučovat, koho by bylo vhodné oslovit s konkrétní nabídkou, což v důsledku ocení obchodník i inzerent.
Mění se díky data-driven přístupu něco pro zaměstnance samotné? Řekněme v každodenním fungování?
Ano, redaktorům se například snažíme pomáhat, aby o obsahu přemýšleli trochu jinak. Připravujeme report, který vyhodnocuje jejich práci – které rubriky nebo autoři fungují, co by se dalo při sestavování článků vylepšit a tak dále. Na ten se mohou každý den dívat a vše si analyzovat. Ale aby ten přechod nebyl tak rychlý, musíme mít překladatele – obsahového analytika – který je k tomu postupnými krůčky vede. Nic nejde dělat na sílu.
Při vaší každodenní práci se často díváte do budoucnosti. Jak z vašeho pohledu vypadá budoucnost médií a žurnalistiky obecně?
Někdo nedávno hezky řekl, že CNC není printové vydavatelství, ale producent obsahu, a musí se tedy měnit podle potřeb člověka. Jestli si nechce číst obsah na papíře, tak mu ho musíme dát na jiném zařízení, v jiné podobě. Čtenář si dnes může vybírat, co ho baví, a s tím se musejí média vyrovnat nejen obsahově, ale i formou, kterou obsah uživateli předkládají.
Jakub Šiler, šéf Business Intelligence týmu v Czech News Center
Jakub Šiler vystudoval sociologii a po studiu vedly jeho první kroky do marketingového výzkumu. Jelikož se ale datům chtěl věnovat naplno a do detailu, brzy přesídlil do Seznamu, kde pracoval jako obsahový analytik, zejména pro internetovou televizi Stream. Když se pak část týmu rozhodla odejít a pod křídly Mall Group založit novou internetovou televizi Mall.tv, Jakub nesměl chybět. Pod vedením Juraje Felixe zde strávil několik inspirativních let, a když pak Juraj Felix dostal na starost digitální transformaci CNC, bylo jasné, kam budou Jakubovy kroky směřovat dál.