Arena Pro
Henkilö täppää digitaalisesti kuvan päälle rakennettuja täppiä erilaisiin lomakkeisiin.

Kuva: Adobe Stock

Kyselylomakkeen sisällön optimointia – oppaita ja tuoreita käytännön oppeja

Yhteiskunta ja ilmiöt

Sähköisillä kyselylomakkeilla voidaan kerätä tietoa ihmisiltä. Huolellisella suunnittelulla tiedot saadaan kerättyä relevantissa muodossa ja vastaajia minimaalisesti vaivaten.


Kyselytutkimus on yhteiskuntatieteiden alueella vakiintunut menetelmä ihmisiä koskevien ilmiöiden selvittämiseen. Annan tässä artikkelissa ohjeita, joita hyvän kyselylomakkeen laadinnassa voi huomioida. Oppikirjatietojen lisäksi tarjoan viimeaikaisiin toteutettuihin kyselyihin perustuvia esimerkkejä onnistuneista ja epäonnistuneista ratkaisuista. Pohdittavat aiheet ja mainitsemani esimerkit liittyvät erityisesti sähköisiin kyselyihin ja niiden toteuttamisen tekniikoihin.

Useimmat artikkelin aspektit ovat relevantteja kyselyalustasta riippumatta. Esimerkiksi Jyväskylän ammattikorkeakoulun käyttämä Webropol, toinen kotimainen SurveyPal ja isot kansainväliset, MS Forms sekä Google Forms, noudattelevat pitkälti toisiaan vastaavia logiikoita. Kyselyaineistojen analysointiin tarkemmin perehtymiseen löytyy suomenkielinen Vehkalahden (2019) oppikirja. Kysymysten ja vastausvaihtoehtojen muotoiluun syventyy selaimessa luettava menetelmäopas (KvantiMOTV, 2010). Artikkelin ulkopuolelle jätän tutkimuseettiset pohdinnat (Tutkimuseettinen neuvottelukunta [TENK], 2024) sekä Euroopan parlamentin (2016) ja kansallisten säädösten (Tietosuojalaki 1050/2018) asettamat tietosuojaan liittyvät vaatimukset, joihin kyselyn laatijan on niin ikään syytä tutustua. Jätän niin ikään tarkastelematta perinteistä Likertin (1932) asteikkoa ja sen numeerista tulkitsemista.

Karkottaako epämukavan kysymyksen pakollisuus vastaajan?

Sähköiseen kyselyyn on helppo laatia hyppyjä, joilla tietyt osiot voidaan automaattisesti ohittaa, jos aiempien vastausten perusteella voidaan olettaa joidenkin kysymysten olevan vastaajalle tarpeettomia. Tällaisia hyppyjä tulee käyttää, jotta vastaaja ei turhaudu joutuessaan vastaamaan kysymyksiin, jotka eivät häntä millään tavalla kosketa. Esimerkiksi työttömältä emme kysy työn kuormittavuudesta emmekä työmatkan kulkutavoista. Näin pidämme vastaajat motivoituneina vastaamaan niihin kysymyksiin, jotka ovat heille relevantteja. Vastaajien motivaation dynamiikan huomioimista on pohdittu tarkemmin Vallin (2017) artikkelissa. Paperisella lomakkeella kysyttäessä hypyt tulee rakentaa selkeästi sanallisesti sekä merkinnöillä ohjeistaen (KvantiMOTV, 2010).

Sen sijaan tutkimuksessa voidaan olla kiinnostuneita jostain henkilökohtaisesta, kaikkia vastaajia potentiaalisesti koskettavasta asiasta, jolloin vastaaminen voi tuntua vaikealta. Esimerkiksi terveyteen ja hyvinvointiin liittyvät aiheet voisivat olla joillekin liian henkilökohtaisia vastattavia. Tällöin on oltava erityisen tarkkana tutkimusetiikan ja tietosuojan (TENK, 2024, Tietosuojalaki 1050/2018) kanssa – mutta samalla myös kerätyn aineiston laatuun vaikuttavien seikkojen kanssa.

Käytännössä täytyy arvioida, kummasta koituu vakavampi haitta tutkimukselle: osittain vajaaksi jäävästä aineistosta vai otoskoon pienentymisestä.

Vastaajan ohittaessa kysymyksen aiheutuu aineistoon eräkatoa (Vehkalahti, 2019, s. 81), eli aukkoja tiettyjen vastaajien riveille vastausmatriisiin. Jos kysymys on asetettu pakolliseksi vastattavaksi, voi vastaaja lopettaa vastaamisen kokonaan, jolloin tuloksena on kokonaisen tilastoyksikön puuttuminen eli yksikkökato (Vehkalahti, 2019, s. 81). Kyselyn laatijan tuleekin puntaroida, vaatiako jokaiseen kysymykseen vastaus, vai antaako vastaajalle mahdollisuus ohittaa joitakin kysymyksiä säilyttääkseen vastaajan mukana edes osittaisilla vastauksilla.

Käytännössä täytyy arvioida, kummasta koituu vakavampi haitta tutkimukselle: osittain vajaaksi jäävästä aineistosta vai otoskoon pienentymisestä. Eräässä liikuntatottumuksia kartoittaneessa kyselyssämme (Hakamäki, Syväoja, Kukko & Heiskanen, 2024) kysyimme lomakkeella: ”Millaiseksi koet tämänhetkisen hyvinvointisi (esim. terveys, jaksaminen, mieliala)?” Arvioimme, että hyvin henkilökohtaisena tämä kysymys voisi potentiaalisesti saada jotkut vastaajista keskeyttämään vastaamisen. Kuitenkaan emme halunneet menettää yhtään vastausta turhaan, vaan tieto toivottiin mahdollisimman usealta vastaajalta. Ratkaisimme tilanteen asettamalla kysymyksen pakolliseksi vastattavaksi, mutta laittamalla järjestysasteikollisten vaihtoehtojen jatkoksi valittavaksi ”En halua vastata”-vaihtoehdon. Lopputulema oli seuraava: yli 1 700 vastaajan joukossa yksikään ei ollut valinnut viimeistä vaihtoehtoa, vaan kaikki olivat löytäneet itselleen sopivan vastauksen asteikolta ”erinomainen – hyvä – kohtalainen – heikko”. Emme tiedä varmuudella, aiheuttiko tämä henkilökohtainen kysymys keräämäämme aineistoon yksikkökatoa, mutta kaikkiaan vastaamisen aloittaneista, oli kesken kyselyn lopettanut noin 15 prosenttia vastaajista.

Vastausten muotoseikkoja – voiko numero olla muuta kuin numero?

Sähköisessä kyselyssä on mahdollista määrittää reunaehtoja vastaukselle: montako merkkiä pitkä vastaus voi pisimmillään olla, onko vastauksen oltava numeerinen, ja jos on, ovatko vain tietyt lukuarvot mahdollisia. Vehkalahti (2019, luku 2) kuvaa laajasti erilaisia mitattavia suureita ja ohjeistaa kysymyksen asetteluun. Lähtökohtaisesti kaikki tieto, jonka halutaan olevan jollain numeerisella asteikolla tulkittava, kannattaa kysyä numeeriseen muotoon pakotettuna. Sanallisia vastauksia vaativiin kysymyksiin taas olisi syytä pohtia mahdollisimman tiivis, mutta kaikki oleellisimmat vaihtoehdot kattava valmis luettelo. Avoimet vastaukset voivat olla sisällöllisesti ”mielenkiintoisia” (Vehkalahti 2019, luku 2), mutta järjestään hyvin hankalia analysoitavia.

Opettajille ja muille koulun henkilökuntaan kuuluville suunnatussa kyselyssä selvitimme taannoin, kuinka suuri määrä luokkia ja oppilaita heidän koulustaan oli mukana eräässä kampanjassa. Kysymys oli osana ilmoittautumislomaketta, jossa vastausta ei pystynyt pakottamaan numeeriseksi, vaan vastaus annettiin avoimeen tekstikenttään. Tulos oli sen mukaista: ”en tiedä vielä”, ”20‒200” tai ”koko yläkoulu” ovat lähtökohtaisesti haastavia vastauksia määrälliseen analyysiin. Osan tämänkaltaisista vastauksista voi kääntää numeeriseksi tiedoksi jälkikäteen selvittämällä koulun oppilasmäärän muuta kautta, mutta osa vastauksista on käytännössä menetettyjä tapauksia.

Numeerisessakin tiedossa on kompastuskivensä

Numeerista tietoa kysyttäessä vastaajaa voidaan ohjata ”vastaamaan oikein” hyvin monella tavalla. Seuraavassa muutama idea pohdittavaksi numeerista tietoa keräävälle:

Pystytkö jo kysyessä rajaamaan mahdottomia arvoja pois? Esimerkiksi henkilön pituus 1,70 cm tai paino 750 kg ovat vallan todennäköisesti yksikkö- tai näppäilyvirheitä, mutta jäävät helposti ”kummittelemaan” aineistoon. Asettamalla vastaukselle kyselyohjelmistossa maksimi- ja minimiarvoton saa osan kertaluokkavirheistä korjattua rajoittamatta realistisia vaihtoehtoja.

Yksiköiden tuomat reunaehdot: kysyttäessä vaikkapa työmatkan pituutta metreinä tai kilometreinä, on hankala rajoittaa vastauksia tietylle välille. Pääosin etätyötä tekevä voi kokea kulkevansa 10 metrin työmatkaa makuuhuoneesta työhuoneeseensa, ja reissutyössä harvemmin käyvä tai logistiikka-alalla työskentelevä voi ilmoittaa matkaksi useita satoja kilometrejä. Tällöin rajoittamisen sijasta voi sähköiseen kyselyyn laatia varmistuskysymyksen: jos vastauksen lukuarvo on mahdollisesti liian pieni tai suuri, voi esiin ohjelmoida ponnahtamaan uuden kysymyksen. Esimerkin tapauksessa vaikkapa: ”Oletko varma työmatkasi pituudesta? Tarkista, että yhdensuuntainen matkan pituus on ilmoitettu kilometreinä.”

Yksiköt ovat luonnollisesti avainasemassa myös aikaan liittyviä asioita kysyttäessä. Jos haluat analysoida aineistoa päivien tarkkuudella, lienee parasta laatia kysymys koskemaan tuntien tai viikkojen sijasta päiviä. Jos taas aikamääreet eri vastaajilla voivat poiketa oleellisesti toisistaan, voi olla välttämätöntä laatia valmiit, analysoitavan ilmiön näkökulmasta mielekkäät vaihtoehdot. Vaikkapa kysymykseen ”Milloin viimeksi olet käynyt elokuvissa?” ei ole helppo päättää, millä ajan yksiköllä vastaajajoukkoa olisi mielekästä pyytää vastaamaan. Näin ollen vastausvaihtoehdoissa voi joutua yhdistelemään viikkoja, kuukausia ja vuosia.

Numeerista arviointia tukemaan yksi vaihtoehto on kirjata lomakkeelle eksplisiittisesti ymmärrys vastaajan epävarmuudesta muotoilemalla vastauskenttä esimerkiksi ”noin _ kertaa vuodessa” (KvantiMOTV, 2010), jolloin muistinvaraisen tiedon antaminen voi helpottua ilman että vastaajalle tarvitsee antaa mahdollisuutta kirjata itse numeron oheen epävarmuutta kuvaavia sanallisia määreitä.

Voi myös pohtia, onko jokin numeerisesti arvioitava asia kysyttävä yhden tunnusluvun sijasta useammalla tavalla. Esimerkiksi kysymykseen ”Kuinka paljon käytät rahaa kuukaudessa liikunta- ja hyvinvointipalveluihin?” vastaaminen voi turhauttaa, jos vastaaja käyttää eri vuodenaikoina hyvin erilaisia ja erihintaisia palveluja – vaikkapa talvisin laskettelun kausikorttiin ja varusteisiin kesäkauden kuluessa ilman kustannuksia pururadalla. Kysymyksestä voisi saada enemmän irti kysymällä saman kysymyksen muutamilla lisämääreillä: ”korkeintaan”, ”vähintään”, ”keskimäärin”…

Jos ilmiö halutaan analysoida määrällisesti ja kaikilta vastaajilta vaaditaan vastaus pakollisena, voi tunnollisen ja huolellisen vastaajan mahdollisia haasteita helpottaa tarjoamalla vaikean numeerisen arviointikysymyksen perään avoin tekstikenttä, esimerkiksi: ”Kuvaa tässä halutessasi tarkemmin, jos numeerinen arviosi sisältää epävarmuuksia.”

Ajattele vielä hetki ennen kuin lähetät kyselyn

Jos kyselyssä on paljon kysymyksiä, joihin vastataan avoimella tekstikentällä, voi tekstikentän kokoa tai sallittua merkkimäärää käyttää ohjaamaan vastaajaa tiivistämään vastaustaan. On myös mahdollista kirjoittaa kysymyksen yhteyteen ohje: ”Vastaa lyhyesti (korkeintaan 2 lauseella)” tai ”Vastaathan lyhyesti.” Muutenkin vastaajan ajankäyttöä on arvostettava ja tarpeettomat ja liian vaikeat kysymykset jätettävä pois lomakkeelta ennen lomakkeen lähettämistä. Nyrkkisääntöjä Valli (2017) tarjoaa korkeintaan viiden sivun mittaista kyselylomaketta aikuisille vastaajille.

Tuoreet silmät voivat havaita ilmeisten virheiden lisäksi epäjohdonmukaisuuksia kyselyn rakenteessa tai kysymysten vastausten rajoitteissa.

Mikäli kyselyn laatimisen aikataulu sallii, on suositeltavaa testauttaa kyselyä kollegoilla tai kohderyhmän edustajilla. Kollegaa voi pyytää pyrkimään vastaamaan kyselyyn kuin oletettu tavanomainen vastaaja. Lisäksi voi pyytää kokeilemaan, onnistuuko numeerisiin kenttiin antaa tarkoituksella kertaluokkavirheitä sisältäviä vastauksia. Tuoreet silmät voivat havaita ilmeisten virheiden lisäksi epäjohdonmukaisuuksia kyselyn rakenteessa tai kysymysten vastausten rajoitteissa. Kohderyhmän edustaja taas havaitsee nopeasti, jos kysymysten tai vastausvaihtoehtojen asettelu ei vaikuta relevantilta. Pienen vastaajajoukon pilotissa nämä löydökset ovat miellyttävämpiä kohdata kuin julkaistussa ja sadoille tai jopa tuhansille vastaanottajille lähetetyssä lopullisessa kyselyversiossa.

Tätä artikkelia kirjoittaessa tuen tutkijoita perusopetuksen, toisen asteen ja korkeakoulujen henkilöstölle suunnattujen, Liikkuva koulu ja Liikkuva opiskelu -ohjelmien (Liikkuva koulu 2024, Liikkuva opiskelu 2024) toimintoja kartoittavien kyselyjen rakentamisessa. Numeerista tietoa ei tällä kertaa juurikaan kerätä, joten sen kanssa en näe potentiaalisia ongelmakohtia. Avoimia kenttiä on vain vähän, ja ne on sijoitettu aihepiirien väleihin niin, että vastaaja pääsee kertomaan haluamansa lisätiedot ja oleelliset haasteet kustakin osiosta. Kyselyistä on tulossa kuitenkin hyvin laajoja – kysymyksiä on useita kymmeniä ja ne jakautuvat seitsemälle sivulle. Onneksi valtaosa kysymyksistä on ”rasti ruutuun”-mallisia vastattavia, joten vastaaminen on mahdollista saada mahdutettua suositeltuun, korkeintaan 15‒20 minuutin aikaikkunaan (KvantiMOTV, 2010). Näin ollen odotuksena on saada kokoon hyvin kattava tietopohja oppilaitosten liikunnan edistämisen kulttuurin kehitystyön tueksi.