Web DR nově ukazuje covidová data. Co znamenají a jak je číst?
Jan KašpárekV DR si zakládáme na tom, že o epidemii píšeme s úzkostlivou snahou o přesnost. Na prvním místě pro nás stojí ochrana zdraví a životů. Naše psaní jsme nyní doplnili pásem s daty: vysvětlujeme, proč jsou právě námi vybraná čísla podstatná.
Pandemie je žurnalisticky nejpokrývanějším tématem naší doby. Probíhá bezpočet nepřetržitých zpravodajských servisů, vrší se tisíce zpráv, komentářů, analýz větší i menší kvality. Neustálé sledování zpráv spíše než dokonalý přehled může přinášet chaos a informační přehlcení. Často vzniká nesprávný dojem, že místo faktů existuje jen změť protikladných názorů různých mluvících hlav opentlených akademickým titulem.
Situaci komplikuje, že novinářský provoz éry internetu často trpí důrazem na rychlost místo kvalitní rešeršní práce a důsledného předkládání kontextu. Epidemické statistiky se často stávají nesrozumitelnou změtí čísel, analýza zaniká ve frázích či politice, věcná debata se pokřivuje do otrockého předkládání protichůdných postojů i za cenu toho, že některé z nich odporují nejen vědeckému poznání, ale mnohdy i prostě zdravému rozumu.
Jakkoli i v českém prostředí existuje mnoho důsledných, analyticky zaměřených novinářů zvyklých číst data a interpretovat odborné poznatky namísto honby za senzací, kvantitativně zjevně převládá holé zpravodajství.
Snadný recept, jak psát o pandemii, samozřejmě neexistuje, natož abychom se odvážili předkládat jeho dokonalou podobu. Tím spíše, že každý je omylný, poznání poučeného laika nelze srovnávat s expertizou a do tématu zasahuje množství logických omylů, jako je konfirmační zkreslení či neochota měnit jednou přijaté postoje.
Jak chceme s pandemií v analytické rovině pracovat my? Informace o věcném charakteru nákazy, virových variantách, účinnosti očkování, strategiích a podobně se snažíme stavět na odborných zdrojích, jako jsou výzkumy publikované v impaktovaných žurnálech. Dlouhodobější bázi poskytuje studium učebnic, medických skript a podobně. Výstupem bývají občasné texty založené přímo na studiích či metodikách tuzemských odborných společností.
Analýza●Jan Kašpárek
Covid: data o očkování náctiletých, třetích dávkách či „superimunitě“ jsou jasná
U zatím nerecenzovaných studií (tzv. preprintů) uvádíme, že jsou předběžné. Preprinty vzhledem k jejich poněkud nižší důvěryhodnosti užíváme tehdy, kdy poskytují jinak chybějící, aktuální data, nejsou ve zvláštním rozporu s předešlým výzkumem, případně ukazují na nový trend ve zkoumání nového koronaviru. Pokud někdo o jejich kvalitě vyslovuje pochybnosti, nebo jsou známy studie s protikladnými výsledky, samozřejmě to netajíme.
Při analýze současné situace zpracováváme hlavně aktuální statistiky a výroky domácích odborníků. Vyhýbáme se hlasům, které se opakovaně a závažně mýlily, případně jsou v rozporu s vědeckou většinou a stanoviskem důvěryhodných institucí, jako je americké Centrum pro kontrolu a prevenci nemocí (CDC).
S rezervou bereme výroky politiků a subjektů, jejichž postoje ovlivňuje zjevný ekonomický zájem. Nejde je ale pominout, předjímají reálné, politicko-ekonomické řešení epidemie. Vlastní úsudek autora je v textech vymezen slovy jako „lze očekávat“ a podobně.
Jako další příspěvek covidové žurnalistice v DR přinášíme „covidpás“, datovou lištu, kterou vidíte v horní části webu, a další vizualizace aktuálních dat o epidemické situaci České republiky.
Co znamenají čísla nahoře?
„Covidpásem“ se snažíme ukazovat méně zavádějící čísla, než jaká je u mediálních portálů zvykem z centrálních statistik překlápět. Krom toho, že v grafu předkládáme srovnání s minulým rokem, některé údaje průměrujeme, abychom omezili zkreslení. Protože zkreslená jsou všechna covidová data. Jak?
Aktuální počet hospitalizovaných se značným zpožděním, ale nekompromisně odráží šíření viru. Pokud exponenciálně roste počet nakažených, víceméně pravidelně se násobí i pacienti v nemocnicích. To jsme ostatně v České republice mohli pozorovat řadu týdnů po sobě — ještě tehdy, kdy se mohla společnost nemístně utěšovat, že čísla nejsou tak vysoká.
Takový je ovšem zákon exponenciálního růstu, s níž nejsme zvyklí pracovat. V každodenním životě se potkáváme spíše s mnohem jednodušším, růstem lineárním.
Údaj je sice zásadní, neboť nemocnice (a hlavně lidské síly jednotek intenzivní péče) tvoří úzké hrdlo systému, na druhou stranu jde o pomalá data, podle nichž se epidemie nedá řídit. Data o jednotkách intenzivní péče, podle nichž se chce řídit končící i budoucí vláda, jsou zpožděná až o dva týdny. Například k napojení pacienta na umělou plicní ventilaci, či dokonce ECMO, se obecně přistupuje poté, kdy nestačí méně invazivní kyslíková podpora.
I data o hospitalizacích jsou trochu náladová. Vykázané počty pacientů mají tendenci narůst v pondělí — mimo jiné proto, že mnoho lidí vyhledává pomoc až po víkendu. Následně tudíž zpravidla o něco klesnou. Takové poklesy ovšem nejsou dány oslabením nákazy.
V číslech také někdy chybí část pacientů, které nemocnice nestihly nahlásit, zpětně se tedy mohou zvýšit. To dvojnásob platí pro počet zemřelých.
Aktuální tragickou bilanci zveřejňujeme v pohyblivém pětidenním průměru, neboť data za poslední den až dva jsou vždy nekompletní. Číslo z minulého dne, jež je tím jediným, co některé weby zveřejňují, je zpravidla dvakrát i vícenásobně podhodnoceno.
Aktuální počty pozitivních testů jsou méně spolehlivým, ale významným ukazatelem, jenž odráží fyzické šíření viru s menším zpožděním. Nutno ale počítat, že záleží na počtu testovaných — čísla jsou proto vždy nižší o víkendu a ve státní svátky, vysoké je naopak vždy úterý, často pátek.
Jakkoli nám počty odhalených nákaz umožňují sledovat přibližný vývoj, s gradující nákazou se údaje znepřesňují. Například teď, při extrémním podílu pozitivních testů, probíhá velká část infekcí neodhalena a promítne se zřejmě až s větším odstupem do hospitalizací, potažmo úmrtí.
Kvůli denním rozdílům v počtech testů má smysl sledovat průměr či medián nově pozitivních, obvykle vztažený na poslední týden. I tento parametr má limity — při prudkém růstu, jaký máme nyní, jej stahují dolů nejstarší výsledky a dny, kdy se testuje málo.
Proto či tehdy, kdy potřebujeme srovnat rozdílně velké celky, se používá incidence přepočítaná na časový úsek a počet obyvatel. V našem prostředí zpravidla počet nakažených na týden a 100 tisíc obyvatel.
Poslední čísla na našem „covidpásu“ ukazují počet nově očkovaných a celkovou proočkovanost populace alespoň jednou dávkou. Důležitost údaje je nasnadě, byť se vyplatí sledovat i průběžná data o podání třetích dávek a pro podrobnější orientaci také typy vakcín. Vyšší zastoupení jednodávkového Janssenu například ukazuje na očkování osob, které chtějí mít „Tečku“ co nejrychleji za sebou — bez ohledu na to, že jako silnější než Janssen vycházejí mRNA vakcíny.
Nesrovnávejme nesrovnatelné
Dále připojujeme data o podílech očkovaných v nemocnicích. Kolem údaje panuje navzdory mnohému vysvětlování stále zmatek — byť někdy zřejmě vybuzený tím, že odpůrci očkování čísla záměrně dezinterpretují. Vzhledem k tomu, že proočkovanost není padesátiprocentní, a vakcinovaných je více než lidí bez očkování, nelze srovnávat absolutní počty.
Na místě je podobný postup, jako když srovnáváme incidenci v různě velkých územních celcích: absolutní čísla přepočítáme ku početnosti daných skupin — třeba na sto tisíc očkovaných či neočkovaných. Konkrétně: proočkovanost Čechů nad šedesát přesahuje osmdesát procent. Když jsme tedy minulý týden měli například 1129 nakažených sedmdesátníků bez vakcíny a 3083 s vakcínou, ve skutečnosti se nakazil dvouapůlnásobně větší podíl neočkovaných. V nemocnicích leželo z dané věkové skupiny 486 neočkovaných a 659 očkovaných, což v přepočtu k velikosti skupin ale činí skoro pětkrát více neočkovaných.
A tak by se dalo pokračovat. Data zkrátka ukazují, jak vakcíny chrání před těžkým průběhem a v omezené míře i před nákazou, byť nutno zohlednit, že se očkovaní pravděpodobně o něco méně testovali. Síla ochrany vychází jako vyšší u mladších osob, což demonstruje již delší dobu patrnou potřebu přeočkovat hlavně seniory třetí dávkou.