Kartta on oivallinen tapa esittää ilmiöiden maantieteellistä sijaintia sekä esiintymisen tai runsauden vaihtelua. Jokapäiväisiä kohdattavia esimerkkejä teemakartoista ovat esimerkiksi maastokartat, sääkartat, ilmastokartat, reittikartat ja, valitettavasti, nykyään jälleen myös rintamalinjoja ja alueiden hallintaa kuvaavat kartat. Aineistoja voi esittää karttapohjilla tarkkoihin sijainteihin liittyen (maasto- ja reittikartat), jatkuvaksi pinnaksi tasoitettuna tilastollisena ennusteena (sää- ja ilmastokartat) tai hallintoalueiden rajoja noudattaen, kiinnostavien muuttujien arvoja eri värein tai symboliikoin toisistaan erotettuna. Tässä artikkelissa keskitytään erityisesti hallinnollisille alueille kootun aineiston visualisointiin. Tällaiset teemakartat ovat tyypillisiä valtioiden tai muiden hallinnollisten alueiden välisiä eroja kuvattaessa.
Ohjelmistovaihtoehtoja ammattilaisille ja kokeilijoille
Edistyneeseen paikkatiedon visualisointiin ja analysointiin on tarjolla monipuolinen kattaus ohjelmistoja. Paikkatietojärjestelmien ja -analyysin alalla vakiintunein, 1960-luvun lopulla alkunsa saanut ohjelmisto on ArcGIS (Esri, USA). Voittoa tavoittelevan Esrin ArcGIS hallitsee globaaleja paikkatieto-ohjelmistojen markkinoita – pelkästään Esrin Suomen toimistossa noin 50 työntekijää pyörittää kymmenen miljoonan euron vuotuista liikevaihtoa (Kauppalehti, 2024). Tarkkoja lukemia on vaikea löytää, mutta maailmanlaajuisesti noin 4000‒6000 henkilöä työllistävän yrityksen liikevaihto lienee 1,1‒1,2 miljardin dollarin luokkaa (esim. RocketReach, n.d., Zippia, n.d.).
Erityisesti viimeisen noin 15 vuoden aikana kehitysharppauksia ottanut QGIS (QGIS Development Team) on tutkimusyhteisön vapaaehtoisten kehittäjien avoimen lisenssin vastine maksulliselle esikuvalleen. Liuta vaihtoehtoisia paikkatieto-ohjelmistoja ja muuta tietoa spatiaalisten aineistojen hallintaan, analysointiin ja visualisointiin on koottu suomalaisten tutkimuslaitosten konsortion rakentamaan Geoportti-palveluun (Geoportti-konsortio, 2024). Paikkatieto-ohjelmistojen monipuolisten ominaisuuksien opetteluun kannattaa panostaa, jos on tarve tehdä syvempää havaintojen sijainteihin, etäisyyksiin ja ominaisuuksiin liittyvää analyysia. Molemmat ohjelmistot toimivat intuitiivisten, hiirellä ohjattavien käyttöliittymien kautta. Valikoihin on koodattu valtava määrä valmiiksi räätälöityjä analysointi- ja visualisointivaihtoehtoja.
Paikkatietoja Suomesta
Karttavisualisointeja varten tarvitaan paikkaan sidottu aineisto, paikkatietoaineisto, sekä aineistoon linkitettävissä oleva karttapohja. Esimerkiksi Tilastokeskus (2024) tarjoaa maksutta useita valmiita suomalaisia paikkatietoaineistoja, joissa aineiston linkitys alueeseen on tehty valmiiksi. Maanmittauslaitos (2024a) tuottaa alueeseen sidotun aineiston lisäksi avoimesti käytettävissä olevia maastokarttoja sekä selainpohjaisen Paikkatietoikkuna-palvelun, jossa pystyy laatimaan ja linkittämään omalle verkkoalustalle alkeellisia teemakarttoja klikkailemalla valikoista löytyviä aineistoja (Maanmittauslaitos, 2024b).
Karttapohjia on tarjolla rasteri- ja vektorimuotoisina. Rasterikartassa karttapohja koostuu säännöllisen muotoisista ja kokoisista karttaruuduista. Esimerkiksi Tilastokeskuksen (2024) Tilastoruudukko on 250 × 250 metrin karttaruuduista muodostuva kartta. Ruutuja karttapohjalla riittää: Suomen eteläisten merialueiden ja Utsjoen Nuorgamin välille mahtuu etelä-pohjois-suunnassa yli 4500 karttaruutua, eikä Eckerön läntisimpien saarten ja Ilomantsin Virmajärven länsi-itä-suuntaista ruudukkoakaan saa kasaan alle 2600 ruudun. Aineiston latauskoko on csv-muodossa noin 499 megatavua (Tilastokeskus, 2024). Vektoripohjainen kartta muodostuu pisteistä, janoista, murtoviivoista ja monikulmioista, jotka on määritetty kulmapisteidensä koordinaattien avulla. Vektorikartalla voidaan esittää hallintoalueille aggregoitua paikkatietoaineistoa tehokkaasti, sillä vektorigrafiikka toimii kohtuullisella tiedoston koolla joustavasti (lähes) mittakaavasta riippumattomasti.
Sekä Maanmittauslaitoksen että Tilastokeskuksen avoimia aineistoja käyttäessä sitoutuu noudattamaan Creative Commons -lisenssiä CC BY 4.0. Lisenssi on hyvin joustava, ja sen alaisten aineistojen käyttöä ei juurikaan rajoiteta. Käyttäjän tulee muistaa karttoja julkaistessaan mainita kartta-aineiston lähde. Tässä artikkelissa kuvattujen operaatioiden toteuttamiseen tarvitaan Tilastokeskuksen (2024) Kuntapohjaiset tilastointialueet -kokonaisuuden shapefile-muotoinen vektorikartta nimeltä kunta4500k. Latauspalvelusta löytyy valikko, josta oikean karttatuotteen pääsee lataamaan. Karttapaketti (zip-muodossa) sisältää useita tiedostoja, jotka puretaan samaan kansioon.
Koodaajan vapaus
Kuten mainittua, yksinkertaisten teemakarttojen laadintaan voi riittää selaimessa klikattava alusta (Maanmittauslaitos, 2024b), mutta esimerkiksi tieteellistä työtä tai ammattimaista raporttia varten vaadittavaa laatua nettiselaimesta leikattu kuvankaappaus ei täytä. Usein soveltavassa tieteellisessä tutkimuksessa tai ammatillisessa raportoinnissa pääpaino on suurten datamassojen analyyseissa ja niiden toistettavuuden varmistamisessa. Tällöin karttavisualisoinnin tuottaminen voi olla käytännöllisintä ja varminta toteuttaa koodaamalla, ja mahdollisesti muussa kuin varsinaisessa paikkatieto-ohjelmistoympäristössä, jonka graafinen käyttöliittymä ei välttämättä ole optimoitu laajoille datamatriiseille. Yksi esimerkki on koodipohjaisesti käytettävä R-tilasto-ohjelma (R Core Team, 2022), jonka saa ladattua maksutta ohjelmiston omasta tietoarkistosta (CRAN Team, 2024). R-ohjelma mahdollistaa yhtä laadukkaiden visualisointien laatimisen kuin paikkatieto-ohjelmistot, mutta samassa ympäristössä pystyy suorittamaan täydellisesti käyttäjän hallitsemia ja toistettavia, kompleksisia tilastomatemaattisia analyyseja, joiden pohjalta visualisoitava aineisto muodostetaan.
Kartta-aineistojen lataamiseen ja käsittelyyn R-ympäristössä löytyy useita vaihtoehtoisia ohjelmistopaketteja. Harjaantuneelle paikkatietojen analysoijalle voi suositella suppeasisältöistä shapefiles-pakettia (Stabler, 2022), joka toimii R:n siltana ArcGIS-ohjelmiston käyttämään shapefile-formaattiin. Paketilla voi ainoastaan lukea ja kirjoittaa shapefile-muotoisia tiedostokokonaisuuksia, ja analysointi ja visualisointi vaatii käyttäjältä enemmän ponnisteluja. Omassa työkalupakissani ensisijainen valinta on ollut usean vuoden ajan rgdal-paketti (Bivand, Keitt & Rowlingson, 2022), jolla teemakarttojen piirtäminen on ollut helppoa ja suoraviivaista. Koska R:n paikkatieto-ominaisuuksissa puhaltaa muutosten tuulet (Pebesma & Bivand, 2022), tutustumme tässä artikkelissa erityisesti sf-pakettiin (Pebesma, 2018), joka pohjautuu spatiaalisten yksiköiden pelkistämiseen pisteiksi, viivoiksi ja monikulmioiksi. Pebesma ja Bivand (2023) ovat kirjoittaneet avoimesti saatavilla olevan oppikirjan paikkatietojen analysointiin sf-paketin avulla.
Suoraviivainen esimerkki R-ympäristössä
Karttapohjan lataamiseen sf-paketista löytyy funktio st_read, joka tarvitsee kaksi argumenttia: hakemistopolun (argumentti dsn) ja karttatason nimen (argumentti layer). Kartan muuttujat voi visualisoida komennolla plot. Esimerkin tapauksessa pelkistetyn kuntakartan piirtämiseen tarvittavat komennot on luetteloitu Kuvan 1. algoritmissa. Ohjelmakoodia tarvitaan yhteensä vain seitsemän riviä, joista kolme on tässä tapauksessa #-merkeillä alkavia kommenttirivejä. Ne auttavat ymmärtämään koodin toimintoja, mutta eivät ole toteutuksen kannalta välttämättömiä.
Kuntakartta sisältää oletuksena aluerajoja vastaavien geometristen muotojen lisäksi vain kuntanumeron, vuosiluvun sekä kunnan nimen suomeksi, ruotsiksi ja englanniksi. Näin ollen kovin kiinnostavia teemakarttoja pelkällä kuntapohjalla ei pääse vielä laatimaan. Visualisoitavaksi teemakartta-aineistoksi tätä artikkelia varten valitsin liikuntapaikkojen Lipas-tietokannasta (Jyväskylän yliopisto, 2024) Suomen jalkapallohallien sijaintikunnat. Aineiston saa poimittua palvelusta Excel-muodossa. Tiedon lukeminen R-ympäristöön onnistuu ainakin Windows-käyttäjälle yksinkertaisimmillaan suoraan leikepöydän kautta kopioimalla Excelissä haluttu osa taulukosta otsikkoriveineen ja lukemalla data R-ohjelmaan. Loogisia ja aritmeettisia operaatioita käyttäen kartta-aineisoon saa laskettua uudeksi muuttujaksi jalkapallohallien lukumäärät kunnittain.
Kuvassa 2 on visualisoitu kyseisen laskennan hieman jalostettu tulos teemakartalla: Lipas-tietokannasta löytyi 85 jalkapallohallia yhteensä 54 kunnasta; yksi halli 42 kunnasta ja useampi kuin yksi halli 12 kunnasta. Lisäelementteinä merkitsin kartalle vähintään kahden jalkapallohallin kuntien nimet, värikoodauksen selitteen, huomautuksen aineiston mahdollisesta puutteellisuudesta sekä aineistojen lisenssitiedot.
Tulostin valmiin kartan tätä artikkelia varten png-tiedostoformaatissa. Heti käytettävissä olevia R:n vaihtoehtoja karttakuvan tulostamiseen olisivat myös jpg-, tiff- tai vektorigrafiikkaa parhaiten tukeva pdf-muoto. On mahdollista kirjoittaa päivitetty kartta uusine tietoineen takaisin shapefile-muotoon, ja pienellä ohjelmoinnilla voi generoida datasta myös json- tai vaikkapa svg-muotoisia karttapohjia, minkä avulla mahdollistuu aineiston siirto rajapintojen kautta useisiin muihin ohjelmiin.
Lopuksi
Artikkelin tarkoitus oli antaa joitakin potentiaalisia vaihtoehtoja paikkaan sidotun tiedon esittämisen ohjelmistoista. Ohjelmistoa valittaessa täytyy puntaroida vähintään työn ulkoasulle asetettuja vaatimuksia, visualisoitavan aineiston ja karttapohjan ominaisuuksia, mahdollista lisäanalyysien tarvetta sekä omia mieltymyksiään ohjelmistojen käyttäjänä.