Aineiston dokumentoinnilla tarkoitetaan tutkimusaineiston kuvailua, eli sen avaamista, mitä aineistot ovat, miten ne ovat syntyneet ja miten niitä voidaan käyttää. Kuvailevaa tietoa kutsutaan metatiedoksi tai metadataksi. Kuvailu auttaa ymmärtämään, tulkitsemaan ja käyttämään aineistoja sekä tutkimuksen aikana että sen jälkeen. Laadukas kuvailu on osa hyvää tieteellistä käytäntöä ja takaa sen, että aineisto on mahdollista löytää ja siihen voi viitata.
Aineiston dokumentoinnilla kuvaat sekä itsellesi että muille, mistä aineistossa on kyse. Suunnittele aineiston dokumentointi mahdollisimman tarkkaan ja aloita se heti tutkimusprojektin alussa. Huolellisesti suunniteltu ja toteutettu dokumentointi helpottaa tutkimustyötä ja sitä on hankalaa, ellei mahdotonta, toteuttaa jälkikäteen.
Tutkimusaineiston metadata. Kuva: Tampereen yliopiston kirjasto: Tutkimusaineistojen hallinta. CC BY 4.0
Kuvailun tarkkuus, laajuus ja toteutustapa riippuvat aineiston määrästä ja luonteesta. Tutkimuksen aikana kuvailu keskittyy aineiston sisällönkuvailuun ja tutkimuksen kannalta olennaisiin tietoihin, kuten muuttujiin ja keruumenetelmiin. Tutkimuksen jälkeen aineistolle laaditaan julkaisuvaiheen kuvailutiedot, joihin sisältyvät esimerkiksi tiedot aineiston sijainnista ja käyttöoikeuksista. Tutkimusaineiston metadata voidaan julkaista, vaikka itse aineistoa ei julkaistaisi.
Metadatastandardit ovat malleja tutkimusaineiston kuvailuun. Monille aloille on laadittu omia metadatastandardeja ja tutkimusaineistoja vastaanottavilla arkistoilla on usein käytössään tietty standardi. Voit etsiä tietoa erilaisista metadatastandardeista esimerkiksi seuraavista oppaista ja sivustoilta:
Seuraavassa on joitakin yleisiä ohjeita niistä asioista, joita projektista ja aineistosta tulisi kuvailla tieteenalasta riippumatta. Nämä tiedot tulee liittää readme.txt-tiedostoon tai vastaavaan aineistojen yhteyteen.
Suunnittele tiedostojen ja kansioiden nimeämiskäytäntö heti projektin alussa. Suunnitelman tulee olla niin tarkka ja laaja, että se kattaa koko tutkimuksesi aikaiset tarpeet. Nimeämissuunnitelman tavoitteina on
Huolehdi siitä, ettet käytä tiedostojen ja kansioiden nimeämisessä henkilötietoja tai muuta sensitiivistä tietoa.