Měření stromů a informací — metodické poznámky k hodině

Z Základy informatiky pro střední školy
Přejít na: navigace, hledání

Související materiály:



Šťastný a spokojený život lze bezpochyby žít i bez znalosti odvození měření informace. Kdybychom ale výsledné závěry předložili jako „spadlé z nebe“ k uvěření, zůstal by zvídavý student nespokojen. Hledání vhodné míry (s předem danými vlastnostmi) pro nějakou veličinu je přitom poměrně neobvyklá, ale o to zajímavější úloha. Proto jsme sepsali toto poměrně přirozené odvození.

Někteří studenti ovšem až tak zvídaví nejsou. Volíme tedy podle jejich úrovně a zájmu:

Můžeme sledovat úplný postup popsaný zde v učebnici. 
Je třeba věnovat zvýšenou pozornost tomu, aby studenti po celou dobu chápali, co děláme a co tím sledujeme. Stejně tak důležité je dobré porozumění předchozí látce, které úvahy velmi usnadní. Není smyslem (a nelze vyžadovat!), aby si studenti odvození zapamatovali. Tak jako i v jiných předmětech, cílem zde je zprostředkovat vhodně zjednodušený myšlenkový proces, kterým informatik dojde k výsledku (resp. kdysi k němu mohl podobně dojít). Pamatovat si studenti budou výsledné poznatky a zkušenost, že je odvodit lze.
Pracujeme s příkladem o neznámé denní době, což je pro studenty přístupná situace, zároveň ale dost bohatá na různé zprávy. Zformulujeme požadavky na „měřítko“ informace a snažíme se hledat, co by požadavkům vyhovělo. Zásadní je požadavek na sčítání množství informace v nezávislých zprávách. Právě ten vede jak v naší zjednodušené školní situaci, tak i ve skutečném odvození s entropií, k použití logaritmu. Postupně prozkoumáme několik možností, jak by snad šlo informaci měřit (počet vyloučených možností, poměr vyloučených možností, počet ušetřených otázek). Pro první dvě najdeme příklady, které porušují naše požadavky. Teprve ušetřené otázky fungují podle očekávání.
Ušetřené otázky jsou zároveň už převlečený logaritmus. To je pro studenty zpravidla obtížné téma. I proto kolem něj kroužíme delší dobu (např. zkoumáním vztahu počtu odpovědí a rozlišených možností na začátku hodiny).
Nebo můžeme obtížnější pasáže přeskočit (a případně se k nim vrátit později).
V následujících odstavcích popsaný průběh hodiny a plán podle projektu PRIM (viz odkaz výše) odpovídají právě tomuto jednoduššímu a zároveň zcela dostačujícímu průchodu, určenému všem středoškolákům. Některé dílčí kroky jsou uvedeny jako fakta, nevyužíváme logaritmus (ovšem pokud jej studenti znají a chápou, souvislost samozřejmě využijeme!). Místo toho pracujeme s počtem ušetřených otázek.
Jmenovitě: Zastavíme se před příkladem s nezávislými zprávami (pojem nezávislosti nezavádíme) a zcela vynecháme oddíly “Požadované vlastnosti měřítka na informace”, “Jak změřit, kolik toho nevíme?“ a “Přesné měření”. Studenti by měli rozumět zelenému shrnutí na konci kapitoly.

V každém případě zde pro většinu studentů vrcholí cesta k měření informace.

Průběh hodiny (zjednodušená varianta)

Prvním krokem je zjištění, že mezi počtem možností a počtem otázek potřebných k určení jedné z nich je úzký vztah. Mnohé žáky (zejm. ty, kteří očekávají přímou úměru) překvapí, jak rychle roste rozdíl mezi oběma veličinami: pro 1000 možností stačí 10 otázek, se 20 otázkami rozlišíme možností milion.

Následně už lze uvažovat, jak vlastně měřit množství informace. Studenti už vědí, že jde o vyloučené možnosti. Porovnávat ale přímo jejich počet nám příliš nepomůže. Studenti snadno najdou případy, kdy bychom dostali absurdní výsledky. Nejlepší smysl koneckonců dává, aby každá optimálně "půlící" otázka dávala informace stejné množství, bez ohledu na to, jestli na polovinu dělí 256 nebo 4 možnosti.

Pro pouhé porovnání informace obsažené v nějakých zprávách lze počítat poměr vyloučených a všech možností: čím vyšší poměr, tím více informace zpráva nese. Vidíme také, že velmi záleží na tom, co už víme (s kolika a kterými možnostmi aktuálně pracujeme).

Pokud chceme množství informace vyčíslit, potřebujeme jít ještě o krok dál. Snažíme se najít způsob, který by odpovídal intuici, že množství informace odpovídá tomu, kolik jsme se dozvěděli. Tedy rozdílu mezi tím, kolik víme po přijetí informace a kolik před tím. A my už máme jedno vcelku použitelné měřítko toho, kolik o něčem (ne)víme: počet otázek, které bychom museli položit, abychom vyloučili všechny možnosti kromě té správné. Množství informace ve zprávě tak můžeme vyjádřit jako počet otázek, které nám daná informace ušetřila. Tyto úvahy se vyplatí ukazovat přímo na nějakém rozhodovacím stromě.

Abychom např. určili jedno číslo ze 32, budeme potřebovat 5 otázek. Pokud nám někdo sdělí, že je hledané číslo násobkem 4, vyloučí tím 3/4 možností a ponechá 8. Pro určení jedné možnosti z 8 potřebujeme 3 otázky. Zpráva nám tedy dvě otázky ušetřila. Obsahovala dvě "jednotky" informace.

Pro úplnost doplníme, že základní jednotkou množství informace je bit. Odpovídá právě vyloučení poloviny možností, neboli odpovědi na jednu půlící otázku. Takovou odpověď lze zaznamenat jednou ze dvou možných hodnot, tradičně 0 a 1. Odtud slovo bit (binary digit).

Tento výklad by díky předchozím zkušenostem pro žáky poměrně přirozený, a s pomocí příkladů a rozhodovacích stromů také dostatečně názorný. Dohromady nejde o téměř nic vyloženě nového, spíše jde o uspořádání známých pozorování a uvedení několika souvislostí.

Hodinu uzavřeme procvičováním.

Další poznámky

  • Ani zde samozřejmě není nutné postupovat přesně podle popisu. Studenti mohou např. něco přeskočit jako triviální poznatek nebo něco sami objeví, ale v nečekaném pořadí. V takovém případě nemá smysl jim bránit a snažit se je vrátit na „správnou cestu“.
  • Veškeré počítání v průběhu hodiny si lze samozřejmě ulehčit použitím počítačů. Přinejmenším ukázkové a celočíselné výpočty doporučujeme provádět ručně, aby studenti mohli lépe sledovat, co se děje.
  • Počítání množství informace přes počet ušetřených otázek není zcela přesné, může se až o jeden bit lišit. Komu ze studentů to vadí, naučí se ty logaritmy, aby mohl počítat přesně.