CRABAPP

Cíl

Základem je vizualizace dat z Centrálního registru administrativních budov (posktytovatel MF ČR). A dále k těmto datům relevantně přidat další datasety, které půjdou připojit (v závislosti na kvalitě).

Řešení

Hlavní technologií pro interaktivní zobrazení dat je Microsoft Power BI. Power BI umožňuje export v podobě embed iframe. Ten je zasazen do statické prezentace (Gatsby) na AWS S3.

MS Power BI umožňuje použít pro zdroj dat širokou variaci zdrojů. My jsme použili MariaDB (v rámci AWS RDS), pro kterou jsme zpracovali níže zmíněné datasety.
Pro zpracování dat z datasetů bylo použito PHP a Python (Pandas).

Výsledek

Největším problémem dat je jejich čistota a standardizace. V rámci datových setů se kterými jsme pracovali se nám povedlo data zpracovat, částečně vyčistit a hlavně spojit. I přes existenci Registru územní identifikace, adres a nemovitostí (RÚIAN), mnoho datasetů tato data nepoužívá, případně pouze omezeně. Dále bohužel některé datasety nejsou kompletní, případně se zde nacházejí chybovosti, které mohou zanést odchylku do prezentovaných hodnot.
S využitím vhodných nástrojů a postupů může být zpracování a zobrazení dat velmi jednoduché, levné a efektivní.
Datové podklady a výstup webu jsou dostupné na Githubu.

Použité datové sady

Autoři


Zpět na vizualizaci