Zradné plochy v grafoch

V grafoch sme zvyknutí, že čo má štyrikrát vyšší stĺpec, to je aj štyrikrát väčšia hodnota. Čo sa ale stane, ak niečo je nie len štyrikrát vyššie ale aj štyrikrát širšie? Nad tým sa menej zdatní infografici nezamýšľajú a dopúšťajú sa chýb. Tí skúsení to vedia a dokážu to využiť vo svoj prospech.

Na začiatok sa zahráme. Tuto poniže je Graf A. Ukazuje počty IT špecialistov v Estónsku. Povedzte tak od oka, koľkonásobne viac mužov tam pracuje v IT v porovnaní so ženami? Počet predaných áut značky Škoda a Honda zase zobrazuje Graf B. Odhadnite koľkonásobne viac sa predalo – och aká si mi krásna, reč moja rodná – Škôd než Hônd?

Ak ste odhadli okolo 4× viac mužov a okolo 16× viac Škôd, tak ste trafili.
(zdroj a zdroj).

Teraz odhadnite v nasledujúcej grafike – zobrazujúcej počty členov politických strán – koľkokrát viac členov má Smer-SD oproti ĽSNS:

Vizuálne by sa mohlo zdať, že je to možno aj 100-krát viac. Rozdiel vo veľkosti panáčikov je naozaj obrovský. V skutočnosti má Smer 14 626 členov a Ľudí Smutne Nezvládajúcich Slovenčinu je 1 510. Rozdiel medzi stranami je v skutočnosti teda len 10-násobný.

Kde sa stala chyba?

Červený panáčik-Smeráčik sa v istom špecifickom ohľade dá považovať za len 10× väčšieho oproti čiernemu. Predpokladám, že tak aj táto chyba vznikla. Grafik v SME (odkiaľ obrázok pochádza) zobral symbol panáčika a oproti čiernemu panáčikovi ho desaťnásobne „zväčšil“. Teda urobil ho 10× širšieho a 10× vyššieho.

A to je podstatné. Ak sa symbol zväčší 10× v oboch smeroch (šírka aj výška) tak sa celková plocha symbolu zväčší 100×. Lebo obsah štvorca so stranou a je a2. Inými slovami, červený pandrlák by mal podľa dát zaberať len 10× viac pixelov ako čierny, no zaberá 100× viac.

Vzájomnú veľkosť objektov totiž vnímame z celej plochy, ktorú vidíme. Nie na základe len výšky či len šírky. Preto je dôležité rozmýšľať v druhých mocninách, ak pracujeme s 2D symbolmi. V prípade tejto grafiky to znamená, že ak chceme, aby červený paňáco bol 10× väčší, tak ho zväčšíme v každom rozmere len 3.16-násobne ( a2 = 10, čiže a je druhá odmocnina z 10 = 3.16). Ľaľa, takto to má vyzerať:

Ak vám druhá odmocnina motá hlavu, je aj iné riešenie. Stačí si fixovať jeden rozmer symbolu a pracovať len s druhým rozmerom. Napríklad v stĺpcovom grafe majú všetky stĺpce rovnakú šírku a mení sa len ich výška (ako napr. v grafe mužov vs. žien v Estónskom IT priemysle.)

Nie je to bug, je to feature!

Plošné vnímanie vieme využiť v náš prospech. Vďaka tomu, že vnímanie plochy rastie kvadraticky, dokážeme do jedného grafu vizuálne spracovať aj hodnoty, medzi ktorými sú obrovské rozdiely. Odborne sa tomu hovorí, že máme väčší dynamický rozsah, t.j. pomer najmenšej a najväčšej viditeľnej hodnoty.

Na príklade to uvidíme najlepšie. Na nasledujúcom stĺpcovom grafe sú zobrazené 4 rôzne hodnoty: koľko sa za 10 rokov v Českej Republike uzavrie manželstiev, koľko z nich sa rozvedie, koľko sa uzavrie registrovaných partnerstiev osôb rovnakého pohlavia a koľko z nich sa rozpadne. (Zdroj)

Dokážeme z tohto grafu odhadnúť, či majú registrované partnerstvá (RP) väčšiu, menšiu alebo porovnateľnú „rozvodovosť“ oproti manželstvám? Nedokážeme. Hodnoty pre RP sú tak malé, že v porovnaní s manželstvami sa ich stĺpce scvrkli na tenučké čiarky a nič sa z nich nedá vyčítať. Ak by sme tieto mikrostĺpčeky chceli zväčšiť na čitateľnú veľkosť, museli by sme adekvátne zväčšiť aj stĺpce pre manželstvá. Tie by ale potom narástli do rozmerov, ktoré sa nevojdú do obrázku.

Obrázok má len obmedzenú výšku, rádovo v stovkách pixelov. Dynamický rozsah je tak obmedzený na rádovo 1:100. Ak využijeme namiesto výšky aj širku, dynamický rozsah sa znásobí na 1:100 × 1:100 = 1:10 000. A tam sa už dá čo-to vidieť:

Aktualizovaný graf ponúka lepší náhľad na to, koľko sa uzavrie registrovaných partnerstiev v pomere k manželstvám, alebo či majú RP podobnú „rozvodovosť“ ako manželstvá.

Ak by nám dynamický rozsah 1:10 000 nestačil, môžeme namiesto 2D obdĺžnikov použiť 3D kvádre, čím dostávame rozsah rozlíšiteľných hodnôt až 1:1 000 000 .

Dá sa to aj horšie

Aby sa grafici v SME necítili tak previnilo, na ilustráciu ešte pridám dielo od grafikov webu shoptet.cz. Tí sa ani nebabrali s tým, že by symboly zväčšovali nejak v pomere k ich hodnotám. Či už kvadraticky alebo nekvadraticky. Jednoducho len nasekali od oka rôzne veľké nákupné košíky. Et voilà infografika!

Možno si poviete, prečo bazírujem na korektnosti grafiky, keď vizualizácie predsa obsahujú aj vypísané presné číselné hodnoty. Z dvoch dôvodov:

  • Ľudia primárne vidia vizuálnu informáciu a k samotnému textu sa dostane už len časť z nich.
  • Ak je infografika nekorektná a treba ju korigovať číslami, tak to nie je infografika, ale Excelovská čiselná tabuľka s ilustráciami.

Použité zdroje:

Autor: Matej Novotný

Vyštudoval matematiku a aplikovanú informatiku na FMFI UK. Je spoluzakladateľom spoločnosti VIS GRAVIS, kde sa venuje interaktívnej prezentácii dát a vizualizácii informácií.

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *