Gerð rannsóknagagnastefnu er meðal aðgerða í Rannsóknarinnviðaáætlun 2024-2026. Hvers vegna rannsóknagagnastefna? Stuðla að því að HÍ geti mætt nýjum áskorunum, sem fyrirsjáanlegar eru vegna tækniþróunar t.d. með tilkomu gervigreindarlausna. Tryggja að HÍ geti uppfyllt ákvæði laga og kröfur vísindasamfélagsins, þar á meðal ýmissa samkeppnissjóða, um gagnastjórnun, gagnahirðingu, gagnaöryggi og opin vísindi og aðrar reglur eins og t.d. persónuverndarreglur. Skýra réttindi og skyldur starfsfólks og nemenda HÍ varðandi söfnun og nýtingu gagna til að tryggja gagnkvæman skilning á eignarrétti og nýtingarrétti á gögnum og afdrifum þeirra við starfs-/námslok. Formgera og auka gagnaþjónustu með samstarfi UTS (IREI), Vísnýs (GAGNÍS) og fræðasviða. Þjónustan feli m.a. í sér ráðgjöf við gerð gagnastjórnunaráætlana og varðveislu rannsóknagagna og skapi samtímis fyrirsjáanleika og auðveldi stýringu á álagi á gagnainnviði. 1. Inngangur Við rannsóknir starfsfólks og nemenda við Háskóla Íslands verður til ógrynni verðmætra rannsóknagagna. Rétt meðhöndlun við söfnun, úrvinnslu, vistun og miðlun gagna er afar mikilvæg; bæði út frá praktískum sjónarmiðum eins og aðgengi samstarfsaðila að gögnum meðan á rannsókn stendur en einnig siðferðilegum sjónarmiðum og vegna upplýsingaöryggis. Rannsóknagögn geta nýst í fleiri rannsóknir en þær sem þeim var upphaflega safnað í tengslum við. Áhersla á langtíma varðveislu og endurnot rannsóknagagna hefur aukist mjög síðari ár og opin vísindi ganga út á að gera rannsóknagögn og -afurðir aðgengilegar sem flestum með jafnrétti, aukið samstarf og góða nýtingu fjárfestinga í rannsóknum að leiðarljósi. Í 4. gr. laga um endurnot opinberra upplýsinga nr. 45/2018 með áorðnum breytingum er fjallað um heimild til að endurnota rannsóknargögn án endurgjalds sem fjármögnuð eru af hinu opinbera. Með framþróun í hverskyns söfnunar- og greiningartækni hefur gagnamagn stóraukist og samtímis kröfur til upplýsingatækni varðandi úrvinnslu, varðveislu og deilingu gagna. Þróun gervigreindar býður upp á nýja möguleika í gagnasöfnun, meðhöndlun og úrvinnslu en henni fylgja jafnframt miklar áskoranir þar sem gæði rannsóknagagna þurfa að vera hafin yfir vafa sé þeim deilt með rannsóknasamfélaginu. Til að tryggja sem besta gagnaumsýslu þarf öfluga gagnainnviði. Við HÍ er gagnaþjónusta samvinnuverkefni ýmissa aðila en þó einkum Vísinda- og nýsköpunarsviðs (sem meðal annars starfrækir opna varðveislugagnasafnið GAGNÍS), Upplýsingatæknisviðs (sem meðal annars starfrækir rafræna rannsóknarinnviðinn IREI) og fræðasviða. Eitt af markmiðum stefnunnar er að efla þessa þætti í þjónustu HÍ og bæta upplýsingagjöf svo að hún nýtist sem best öllum sem á þurfa að halda. 1.1 Umfang Rannsóknagagnastefna HÍ tekur til rannsóknagagna, á hvaða formi sem þau kunna að vera, sem safnað er og til verða í tengslum við rannsóknir sem stundaðar eru við HÍ. Tilgangur stefnunnar er að stuðla að ábyrgri söfnun, varðveislu, úrvinnslu og miðlun rannsóknargagna í samræmi við kröfur vísindasamfélagsins um opin vísindi, kröfur samkeppnissjóða um gagnastjórnunaráætlanir (data management plan) og með tilliti til gagnaöryggis, persónuverndarsjónarmiða, eignarhalds, hugverkaréttinda og fleira. Þar sem rannsóknarstarf HÍ er að verulegum hluta fjármagnað af hinu opinbera tekur stefnan mið af ákvæðum laga nr. 45/2018 (með síðari breytingum) um endurnot opinberra upplýsinga og einnig Tilskipun Evrópuþingsins og -ráðsins (ESB) 2019/1024 um opin gögn og endurnotkun upplýsinga frá hinu opinbera, þar sem eftirfarandi gildir um rannsóknagögn: Gögn á stafrænu formi, önnur en vísindarit, sem safnað er eða sem verða til við vísindarannsóknir og eru notuð sem sönnunargögn í rannsóknarferlinu eða eru almennt viðurkennd í rannsóknasamfélaginu sem nauðsynleg til að sannreyna niðurstöður og árangur rannsókna Rannsóknagögn ná yfir tölfræðilegar upplýsingar, niðurstöður tilrauna, mælingar, athugasemdir sem aflað er með vettvangsvinnu, niðurstöður kannana, upptökur viðtala og myndir. Þau taka einnig til lýsigagna, forskrifta og annarra stafrænna hluta Tilskipunin og sú löggjöf sem af henni leiðir fjallar aðeins um gögn sem þegar eru á stafrænu formi en rannsóknagagnastefna HÍ nær hins vegar til rannsóknargagna á hvaða formi sem þau kunna að vera þó að vissulega séu stafræn gögn þar fyrirferðarmest. Rannsóknagagnastefnan á erindi við alla sem tilheyra rannsóknarsamfélagi HÍ hvort sem það er akademískt starfsfólk, framhaldsnemar (og bakkalárnemar þegar þeir koma að gagnaöflun) eða starfsfólk sameiginlegrar stjórnsýslu og annarrar stoðþjónustu. Auk laga um endurnot opinberra upplýsinga og tilskipun ESB um opin gögn og endurnotkun upplýsinga frá hinu opinbera er rannsóknagagnastefnu HÍ ætlað að uppfylla og styðja við eftirfarandi, stefnur og leiðbeiningar: Stefna Háskóla Íslands - HÍ26 Rannsóknarinnviðaáætlun HÍ Stefna HÍ um opinn aðgang Upplýsingaöryggisstefna HÍ Vísindasiðareglur Gervigreindarstefna 1.2 Ábyrgð Háskóli Íslands er eigandi rannsóknagagna sem safnað er í tengslum við starfsemi skólans nema um annað sé samið. Sem slíkur ber hann ábyrgð á varðveislu gagna og lýsigagna sem verða til í tengslum við allt rannsóknastarf starfsfólks og nemenda. Einnig ber HÍ ábyrgð á varðveislu og umsýslu sýna (t.d. í rannsóknum í líffræði, jarðfræði og efnafræði), muna, upptaka, ljósmynda, vinnubóka og annars sem safnað er í tengslum við rannsóknir og öðru sem teljast má til frumgagna. Ábyrgð HÍ á varðveislu nær einkum til gagna sem liggja að baki birtum rannsóknaniðurstöðum og til grundvallar einkaleyfum. HÍ ber ábyrgð á varðveislu bæði meðan viðkomandi einstaklingar eru í starfi eða námi og eftir að því er lokið. Aðstoðarrektor rannsókna- og þverfræðileika ber ábyrgð á innihaldi stefnunnar og Vísinda- og nýsköpunarsvið ber ábyrgð á innleiðingu hennar. IREI (Upplýsingatæknisvið) og GAGNÍS (Vísinda- og nýsköpunarsvið) bera ábyrgð á gerð leiðbeininga og aðstoð við rannsakendur hvað varðar gagnastjórnun. Þessir aðilar bera einnig ábyrgð á að rannsakendur hafi aðgang að nauðsynlegum innviðum til öruggrar varðveislu gagna. Skjalasafn HÍ ber ábyrgð á langtíma varðveislu skjala sem tengjast rannsóknum, líkt og annarri starfsemi HÍ, og er rannsakendum til ráðgjafar um vistun og frágang skjala. Sviðsforsetar bera ábyrgð á að fylgt sé reglum og skilgreindu verklagi um varðveislu eða eyðingu gagna þegar starfsfólk á viðkomandi fræðasviði hættir starfi við HÍ og þegar nemendur ljúka eða hverfa frá námi. Deildarforsetar og stjórnendur námsbrauta bera ábyrgð á því að fylgt sé reglum og skilgreindu verklagi um gagnastjórnun, gagnahirðingu, gagnaöryggi og opin vísindi í verkefnum nemenda. Ábyrgðarrannsakendur (PI) bera ábyrgð á því að meðrannsakendur (þ.m.t. nemar) fylgi reglum og skilgreindu verklagi um gagnastjórnun, gagnahirðingu, gagnaöryggi og opin vísindi. Þeir bera þannig ábyrgð á að hlíta reglum sem varða persónuverndarlöggjöf (GDPR), reglur um meðferð viðkvæmra upplýsinga og upplýsingaöryggi. Þetta á ekki síst við þegar um örgögn er að ræða. Ábyrgðarrannsakendur bera ábyrgð á að afla samþykkis Vísindasiðanefndar, Siðanefndar háskólanna um vísindarannsóknir og Persónuverndar eftir atvikum og fylgja reglum þeirra varðandi meðferð gagna. 2. Gagnaumsýsla Skipulag gagnaumsýslu miðast við lengd rannsóknarverkefnis og lífsferil gagna frá söfnun til langtímavarðveislu eða förgunar. Meðferð gagna er háð eðli þeirra og þarf sérstaklega að huga að meðferð gagna sem geta leitt til einkaleyfa, persónugreinanlegra gagna og viðkvæmra gagna en slík gögn krefjast takmarkaðs aðgengis, aftengingar við persónuauðkenni eða förgunar um leið og gögn hafa verið nýtt í þeim tilgangi sem þeim var safnað. Ávallt skal fylgja Vísindasiðareglum Háskóla Íslands í öflun gagna og afla tilskilinna leyfa þegar við á. Ábyrg söfnun gagna og trygging gæða þeirra er forsenda þess að hægt sé að nota gervigreind með ábyrgum hætti í vinnslu og greiningu gagna en slíkt á aðeins eftir að færast í vöxt á komandi árum. 2.1 Gagnastjórnunaráætlanir Gert er ráð fyrir að í öllum rannsóknum þar sem safnað er gögnum af einhverju tagi sé gerð formleg gagnastjórnunaráætlun. Þetta er meðal annars mikilvægt vegna þess að styrkveitendur gera í auknum mæli kröfur um að gagnastjórnunaráætlanir fylgi styrkumsóknum um rannsóknarstyrki eða þegar gengið er frá samningi. Horizon Europe og NordForsk hafa farið fram á gagnastjórnunaráætlanir um hríð og Rannsóknasjóður (Rannís) innleiddi þessa kröfu með skýrari hætti en áður í sínar reglur vorið 2025. Gagnastjórnunaráætlun rammar inn lífsferil rannsóknagagna; söfnun, framsetningu og varðveislu meðan á rannsókn stendur, hvernig öryggisafritun stafrænna gagna er háttað og hvernig og hve lengi gögn verða varðveitt að rannsókn lokinni. Hún tekur á miðlun gagna milli aðila á rannsóknartímanum, skilgreinir hvaða þátttakendur hafa aðgang að hvaða gögnum og hvernig þeirri stýringu er háttað og fjallar einnig um takmarkanir á nýtingu, höfundar- og hugverkaréttar, ábyrgð rannsakenda og nauðsynleg aðföng. Tilskilin leyfi (lagaleg og vísindasiðferðileg) skulu tilgreind og greint frá því hvernig farið verður með viðkvæmar upplýsingar. Einnig er gerð grein fyrir lýsigögnum fyrir þau gögn sem um ræðir. Gagnastjórnunaráætlanir eru lifandi áætlanir og geta tekið breytingum meðan á rannsókn stendur. HÍ gefur á hverjum tíma út leiðbeiningar um gerð gagnastjórnunaráætlana og einnig geta rannsakendur fengið aðstoð um þetta efni hjá GAGNÍS (Vísinda- og nýsköpunarsviði), IREI (Upplýsingatæknisviði) og hjá fræðasviðum. 2.2 Gagnahirðing Gagnahirðing (data stewardship) felur í sér að tryggja að gögn séu meðhöndluð á ábyrgan hátt í gegnum allan lífsferil þeirra og í samræmi við formlega gagnastjórnunaráætlun. Hún snýst um að viðhalda gæðum gagna, tryggja réttmæti, samræmi og rekjanleika þeirra, auk þess að sjá til þess að gögn séu örugg og aðgengileg þeim sem hafa heimild til notkunar. Markmið gagnahirðingar er að skapa traust umhverfi þar sem gögn nýtast sem áreiðanlegur grunnur fyrir ákvarðanatöku, nýsköpun og rannsóknir, án þess að öryggi eða persónuvernd sé stefnt í hættu. Í rannsóknarverkefnum er mikilvægt að umsýsla gagna sé í höndum aðila sem hafa fengið viðhlítandi þjálfun í gagnahirðingu. 2.3 Vistun og miðlun gagna Meðan á rannsókn stendur þurfa samstarfsaðilar að hafa aðgang að gögnum á öruggu svæði sem jafnframt leyfir deilingu gagna. Eindregið er mælst til þess að rannsakendur visti ekki gögn á eigin hörðum diskum og HÍ býður ýmsar lausnir til varðveislu gagna, svo sem á Teams og Sharepoint sem ættu að henta mörgum rannsóknarverkefnum. IREI býður upp á aðgangsstýrða skýjalausn (NextCloud) fyrir vistun rannsóknagagna og deilingu þeirra á meðal samstarfsaðila meðan á rannsókn stendur, og einnig lausnir fyrir langtímavarðveislu að lokinni rannsókn. IREI veitir rannsakendum ráðgjöf varðandi gagnageymslu og hægt er að sækja um geymslupláss hjá þjónustugátt IREI. Breytileg heimsmynd felur í sér ákveðna áskorun þegar kemur að því að meta hvort erlendir samstarfsaðilar eru traustsins verðir þegar ákveðið er að deila með þeim gögnum. Mikilvægt er að fylgjast með þróun gagnaöryggismála, einkum á Norðurlöndum og í Evrópu, og skilgreina ábyrgð, hlutverk, tæknilausnir og verklag þegar kemur að því að tryggja öryggi rannsóknagagna. Að rannsókn lokinni þarf að gera ráð fyrir að gögn séu varðveitt, ýmist aðgengileg öðrum í opnum varðveislusöfnum (sjá kafla 3: Opið aðgengi að gögnum) eða í aðgangsstýrðum gagnageymslum um óákveðinn tíma. 2.4 Afdrif gagna við starfs- eða námslok Þegar starfsfólk hættir starfi við HÍ og þegar nemendur ljúka eða hverfa frá námi, þarf að tryggja varðveislu eða eyðingu gagna samkvæmt viðeigandi reglum og verklagi. Þegar kemur að því að meta hvað teljist til gagna er mælst til þess að horft sé til gagna í víðum skilningi. Meðal annars innihalda vinnubækur nema í rannsóknartengdu framhaldsnámi oft gögn sem ástæða er til að varðveita með framtíðarnot í huga. Sama á við um gögn sem safnað hefur verið af nemendum í tengslum við ýmis námsverkefni en í þeim geta falist möguleikar til verðmætrar endurnýtingar ef rétt er staðið að varðveislu og skráningu. Þegar tekin er ákvörðun um afdrif gagna geta eftirfarandi atriði meðal annars skipt máli: Þarf að varðveita gögnin vegna vísindabirtinga eða annarra krafna og þá, hve lengi? Innihalda gögnin upplýsingar sem eru þess eðlis að nauðsynlegt er að farga þeim? Er einhver kostnaður sem hlýst af því að varðveita gögnin? Er um að ræða gögn sem ekki er hægt að safna aftur (t.d. vöktunargögn)? Almennt skal miða við að einstaklingar sem komið hafa að gagnasöfnun eða rannsóknum vegna starfs eða náms við HÍ geti áfram haft aðgang að þeim rannsóknargögnum þó viðkomandi starfi eða námi sé lokið. Undantekningar geta verið frá þessu ef reglur styrkveitanda kveða á um annað og ef um annað var samið þegar viðkomandi einstaklingur kom að því starfi eða rannsókn sem um ræðir. Afnot og aðgangur að rannsóknargögnum eftir lok starfs eða náms er þó ætíð háður sömu reglum og lagaskilyrðum og þeim sem gilda um starfsfólk eða nemendur HÍ á hverjum tíma. 3. Opið aðgengi að gögnum Mælst er til þess að rannsóknargögn séu varðveitt til lengri tíma í opnum varðveislusöfnum og gerð aðgengileg til endurnýtingar eftir því almenna viðmiði að gögnin séu eins og opin og hægt er og eins lokuð og nauðsyn krefur og í samræmi við FAIR skilyrðin (findable, accessible, interoperable, reusable). Athugið að gögn geta verið FAIR þótt aðeins séu birt lýsigögn. Það þarf, með öðrum orðum, ekki nauðsynlega að birta gögnin sjálf til að uppfylla FAIR skilyrðin. GAGNÍS er íslenskt varðveislusafn sem rekið er af HÍ og sem tekur við gögnum, óháð fræðigreinum, og birtir í opnu aðgengi samkvæmt FAIR viðmiðum. Á vef GAGNÍS má finna ítarlegar leiðbeiningar um hvernig ganga skuli frá gögnum til varðveislu og til birtingar. Rannsakendum gefst líka kostur á að birta gögn í varðveislusöfnum sem hýst eru erlendis en slík varðveislusöfn geta verið bæði almenns eðlis og afmörkuð við tiltekin fagsvið. Dæmi um almennt varðveislusafn sem nýta mætti til að hýsa íslensk gögn er Zenodo sem þróað er í tengslum við CERN og er aðgengilegt öllum án endurgjalds. Innan Zenodo eru hýst undirsöfn eins og t.d. EU Open Research Repository þar sem rannsóknarafurðir verkefna sem styrkt eru af Horizon Europe eru varðveittar og verkefna innan Aurora háskólasamstarfsins sem HÍ tekur þátt í. Á Zenodo er líka að finna leiðbeiningar um hvernig gögn eru útbúin til birtingar. Bæði GAGNÍS og Zenodo eru OpenAire samhæfð sem merkir að hægt er að nálgast þau í gegnum OpenAire sem er gátt inn í fjölda varðveislusafna sem uppfylla gæðastaðla þess. Þegar ákvörðun er tekin um hvort birta skuli gögn hjá GAGNÍS eða alþjóðlegum söfnum er gott að hafa í huga að ekki er alltaf hægt að tryggja að allar breytur úr íslenskum gagnasöfnum skili sér rétt í erlendum varðveislusöfnum (t.d. ef gögn innihalda séríslenska stafi). Auk þess getur verið auðveldara að fá yfirsýn yfir íslensk gögn í OpenAire, komi þau úr sama varðveislusafni. facebooklinkedintwitter