Siirry pääsisältöön

Lapin AMKin Avoimen TKI-toiminnan opas (päivitys käynnissä)

Aineistojen tallentaminen ja organisointi

Hankkeessa kerätyn aineiston hyvät tallennus- ja dokumentointikäytännöt auttavat välttämään virheitä ja sekaannuksia sekä helpottavat aineiston jakamista eri toimijoiden kesken. Ne varmistavat aineistojen löydettävyyden ja käytettävyyden vielä hankkeen jälkeenkin.

Tietoturvan varmistaminen on oleellinen osa tallentamista. Se edellyttää muun muassa organisaation tietoturvaohjeistuksen noudattamista ja teknisiä toimenpiteitä. Näin varmistetaan tiedon luottamuksellisuus.

Alla olevista taulukoista löydät tietoa tiedostojen hallintaan sekä aineistojen tallentamiseen ja tietoturvaan liittyvistä asioista.

Tiedostojen hallinta

Tiedostojen organisointi ja nimeäminen
  • Nimeämiskäytännöt on hyvä suunnitella ja sopia hankkeen alussa. 
  • Nimeämisen tulee olla johdonmukaista ja selkeää.
  • Nimien ei tulisi olla liian pitkiä eikä liian lyhyitä
  • Hyvä tiedostonimi on loogisesti jäsennetty ja se kertoo sisällöstä (esim. hankkeen nimi, aineiston nimi, tekijä, pvm vuosi-kk-pv versionumero).
  • Käytä tarvittaessa lyhenteitä. Lyhenteiden merkitys tulee dokumentoida, jotta lyhenteet ovat ymmärrettävissä. 
  • Vältä erikoismerkkejä.

Systemaattiset aineistojen organisointi ja dokumentointi helpottavat hankkeen aineistojen löytymistä ja käyttöä hankkeen aikana ja luovat edellytykset myös aineistojen mahdolliselle jatkohyödyntämiselle.

Tiedostomuodon (tiedostoformaatin) valinta
  • Tiedostomuodon  valinta kannattaa tehdä varhaisessa vaiheessa, jotta vältytään esimerkiksi turhilta formaatinmuutoksilta.

  • Tiedon siirtäminen formaatista toiseen ei yleensä onnistu täydellisesti, jotain tietoa saattaa hävitä, esim. tekstin muotoilut, taulukoiden tietosisältö, kuvien resoluutio tai äänen laatu.

  • Tiedostomuodon tulisi olla sellainen, joka on käytettävissä mahdollisimman pitkään. Kokonaan ohjelmistoriippumattomia tallennusformaatteja ei kuitenkaan ole tarjolla.

Yleisiä tiedostoformaatteja, joita useimmat eri ohjelmistot tukevat:

Teksti:
txt, .odt., .rtf, .csv, PDF/A, .html,.xml

Kuva: jpeg, tiff

Video: MPEG-4 (.mp4)

Ääni:  FLAC

Lisätietoja:

UK Data Service

Tietoarkiston ohje: tiedostoformaatit ja ohjelmistot

Dokumentointi

Aineiston hyvällä dokumentointilla varmistetaan aineiston ymmärrettävyys. Dokumentoitavia asioita ovat mm.

  • miten aineisto on kerätty
  • miten sitä on käsitelty, kuka ja milloin
  • käytetyt laitteet ja ohjelmistot
  • muuttujien arvot
  • käytetyt koodit ja lyhenteet
  • eri versioiden hallinta
  • laadunvarmistusprosessit
  • muu tieto, jolla varmistat aineiston ymmärrettävyyden

Datan yhteyteen on hyvä tehdä erillinen readme.txt-tiedosto, jossa kokonaisuus ja dokumentointi on kuvailtu.

 

 

Tiedostojen tallentaminen ja tietoturva

Tiedostojen tallennuspaikan valintaan vaikuttavat organisaation omat ohjeet ja tarjolla olevat tallennuspalvelut

Lapin AMKin tietoaineistojen käsittelemistä ja tallentamista koskevat yleiset ohjeet ohjaavat käyttäjää valitsemaan tarpeeseen sopivan tiedoston tallennuspaikan ja kertoo mitä voidaan tallentaa, minne ja millä ehdoin.

 

Pilvipalveluohjeita

Jokainen pilvipalvelun käyttäjä vastaa itse sinne tallentamistaan tiedoista. On syytä harkita, mitä TKI-toimintaan liittyvää materiaalia pilvipalveluun tallennetaan ja/tai siellä käsitellään. Pilvipalvelu ei takaa tietojen säilymistä palvelussa vakavissa vikatilanteissa. Myös käyttäjän itse vahingossa poistamaa tietoa ei saada palautettua.

Pilvipalveluiden soveltuvuutta tallentamiseen voidaan arvioida esimerkiksi käyttämällä korkeakouluille soveltuvaa eDuuni-wikistä löytyvää Pilviohjetta

Korkeakoulujen yhteinen arviointiryhmä on koonnut arviointisivuston, jossa on arvioitu eri pilvipalveluiden tietoturvan tasoa ja palvelun soveltuvuutta käytettäväksi organisaation toiminnassa.

 

Kansalliset palvelut

IDA on tutkimusdatan säilytyspalvelu, joka kuuluu Fairdata-palvelukokonaisuuteen. Se soveltuu hankkeen aikaiseen datan tallettamiseen ja datan jakamiseen käyttäjien kesken. Myös valmis data voidaan säilyttää IDAssa muuttumattomassa tilassa. Se ei sovellu arkaluontoisia henkilötietoja tai biometrisiä tunnisteita sisältävälle datalle eikä myöskään raskaassa käytössä olevalle  laskentadatalle tai jatkuvasti muuttuvalle datalle. Korkeakouluille on varattu IDAaan maksuttomat säilytyskiintiöt.

ePouta on sensitiivisen datan käsittelyyn tarkoitettu CSC:n palvelu. Sen kehitystyö on vielä meneillään.

 

Tietoturva
Tietoturvasta huolehtiminen on tärkeää aina, mutta erityisen tärkeää se on silloin, kun on kyse arkaluontoisesta aineistosta.

  • Tietoturvan varmistamiseen kuuluu aineiston tuhoutumisen, vahingoittumisen ja muuttumisen tai varastamisen estäminen sekä pääsy- ja käyttöoikeuksien hallinta.
  • Myös varmuuskopiointi on osa tietoturvaa.

Tietoturvaluokitus selventää mitä tarkoittaa tiedostojen tallennuksessa korkea suojaustaso, perussuojaustaso ja julkiset tiedot. Tietoturvaluokitus listaa myös esimerkkejä eri suojaustasoihin kuuluvista tiedostoista. 

Tutustu myös Lapin AMKin intrassa olevaan Tietoturvaohjeistukseen.