Faktor lži v politických grafoch

Stĺpcový a čiarový graf je asi to najjednoduchšie, s čím sa môžeme pri vizualizácii dát stretnúť. Je preto fascinujúce, keď niekto dokáže tak jednoduchú vec urobiť zle. Až sa niekedy človeku nechce veriť, že to bola len nedbalosť.

Takto napríklad údajne rástli preferencie strany Sieť podľa ich grafika:

siet-blur

Úmyselne som v obrázku rozmazal hodnoty, pretože tak grafy vníma drvivá väčšina ľudí. Naše mozgy sú lenivé (a čo si budeme hovoriť, niektoré ešte lenivejšie), takže akonáhle sa mozog informačne nasýti z grafickej informácie, s písmenkami si už veľmi hlavu neláme.

Preto tento graf vizuálne komunikuje takmer trojnásobný nárast medzi prvým a posledným stĺpcom, i keď v skutočnosti bol nárast preferencií len z 12 na 13.8 percenta.

Ako to urobiť dobre?

Sieť tu predvádza učebnicový príklad toho, čomu sa hovorí posúvanie nulovej hladiny resp. posunutie osi Y. Nulová hladina je hodnota, ktorá sa v príslušnom grafe zobrazí ako stĺpec s nulovou výškou. Najčastejšie sa za takú hodnotu volí nula. Sieť si nulovú hladinu posunula z 0 na 11.

Sú situácie, kedy má posunutie nulovej hodnoty svoje opodstatnenie. Napríklad tlak vzduchu v atmosfére má obvykle hodnoty v rozmedzí 950-1050 hPa, a tak má zmysel posunúť nulovú hladinu na 900 hPa. O žiadne informácie neprichádzame a bez posunutia hladiny by výsledný graf obsahoval samé podobne vysoké a tým pádom ťažko rozlíšiteľné stĺpce.

V prípade volebných preferencií sa nedá hovoriť o zmysluplnom posúvaní nulovej hodnoty. Nula by mala zostať nulou. Aj za cenu toho, že vývoj preferencií už nebude vyzerať až tak sexy:

siet-fixed

Rozpor medzi číselnými hodnotami a ich vizuálnym stvárnením nazval priekopník vizualizácie Edward Tufte „faktorom lži„. Ak je tento faktor rovný 1, je graf korektný. V prípade grafu preferencií strany Sieť bol dosiahnutý faktor lži rovný 12.

To znamená, že graf ukazoval nárast 12-krát väčší než bola pravda.

Kandidát na Kažimírov pohár

Ak sa vám 12-násobné zveličenie zdá veľa, počkajte, kým vypočítame ako šikovne s grafikou narába (údajne spravodajská) televízia TA3. Takto sa na u nich robí grafika, keď príde objednávka na graf nárastu počtu zamestnancov za vlády R.Fica:

ta3

Aj keby tieto dáta boli korektné (o čom má vážne pochybnosti Strana SKOK! aj Jozef Mihál z SaS), grafické stvárnenie posúva nulovú hladinu na z brucha vymyslenú hodnotu 1 640 000. Vďaka tomu sa im podarilo vytiahnuť faktor lži na úctyhodných 30 (slovom „TRIDSAŤ“) a už začiatkom roka sa tak stávajú horúcim kandidátom na Kažimírov pohár za rok 2015.

Vypočet:
Relatívna zmena v údajoch posledných dvoch stĺpcov:
(1 825 799 – 1  696 655) / 1 696 655 = 7.6%.
Relatívna zmena vo výške posledných dvoch stĺpcov (v pixeloch):
(328px – 100px) / 100px = 228%.
Pomer 228% a 7.6% = 30.

V skutočnosti mal graf vyzerať takto:

ta3-fixed

Výroba poklesu

Prifarbovanie reality sa nemusí týkať len nárastu preferencií, či zamestnanosti. Rovnako dobre sa dá zveličiť pokles. Napríklad ak posunieme nulovú hranicu v grafe inflácie z 0% na 5.5% ako v nasledujúcom grafe (ktorý, ak si dobre pamätám, publikovalo SME):

inflacia

Vizuálne inflácia klesla takmer na nulu, ale čísla hovoria niečo iné.
Lenže, kto už len číta nejaké čísla, že? Faktor lži = 2,5.

A keď nie je aký pokles zveličovať, môžeme ho úplne vyfabrikovať. Ako tu, keď televízia Markíza domrvila graf počtu zamestnancov v stavebníctve tak, ako by za roky 2009-2010 drasticky klesal.

stavebnici

Všimnite si číselné hodnoty a ich grafické reprezentácie. Špeciálne prvý a posledný stĺpec. Tu už sa ani nedá vypočítať faktor lži, toto je mimo rozum, vesmír a vôbec

Rozdiely rýchlo a lacno

Stĺpcové grafy odovzdávajú vizuálnu informáciu predovšetkým o rozdieloch medzi jednotlivými hodnotami. Preto je dôležité zachovať rovnakú metriku pre všetky hodnoty v grafe. Keď to grafik neurobí, dosiahne zmätok aj bez toho, aby musel posúvať nulovú hodnotu:

sdku1

Nielen, že majú stĺpce rôznu šírku (o tom niekedy nabudúce), ale aj škála na jednotlivých stĺpcoch je akási čudná. Graf na prvý pohľad budí dojem, že SDKÚ (druhý stĺpec) bol v tom čase jasný líder opozície. No čísla ukazujú niečo iné. V skutočnosti rozdiely SDKÚ, SaS a KDH boli zanedbateľné. Takto by mal vyzerať korektný graf:

sdku2

A keď sa grafik utne poriadne, tak dokáže rozdiel nie len zveličiť, ale dokonca ho vyrobiť tam, kde nie je. A zaprieť ho tam, kde je. Ako sa zadarilo v Českej televízii:

ct_penize_za_volby

Omyl či manipulácia?

Polemika o tom, ktoré omyly vo vizualizácii dát sú naozaj omylmi a ktoré sú cielenými manipuláciami, je na mieste. V grafe z Českej televízie je chýb toľko, až by sa zdalo, že grafik len použil nejaký starší vizuál a doplnil do neho nové čísla bez toho, aby upravil dĺžku stĺpcov. Česká pirátska strana na to má iný názor a uvádza viacero ďalších prehreškov vo vizuálnej komunikácii Českej televízie.

My nechajme túto debatu nateraz bokom. Univerzálne platí, že najlepšou cestou ako sa vyhnúť obvineniam z vizuálnej manipulácie je nerobiť v grafoch chyby vôbec. A toho by sa mali autori držať.

Vzhľadom na zákaz zverejňovania politických prieskumov v období krátko pred voľbami budeme teraz asi o nejaký študijný materiál ukrátení. Ale sledujme, čo iné sa v médiách vynorí.

Ďakujem mojim študentom a kolegom za zásobovanie ma vadnými grafmi, z ktorých niektoré som použil v tomto článku. Ak na niečo podobné narazíte aj vy, poteším sa, ak mi dáte vedieť.

Autor: Matej Novotný

Vyštudoval matematiku a aplikovanú informatiku na FMFI UK. Je spoluzakladateľom spoločnosti VIS GRAVIS, kde sa venuje interaktívnej prezentácii dát a vizualizácii informácií.

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *